科大讯飞成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,专业从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,专注于让机器“能听会说,能理解会思考”,用人工智能建设美好世界。 5月6日,科大讯飞又发布了讯飞星火认知大模型,它是基于大模型的“1+N”产品路径,“1”指通用认知智能大模型,“N”指大模型在教育、办公、汽车、人机交互等各个领域的落地。在测试的时候优于此前百度发布的“文心一言”,也可能要好于阿里巴巴的通义千问。甚至评测对比中,讯飞星火认知大模型在认知文本生成、知识问答、数学能力三大能力上已超过去年大火的ChatGPT。具体表现如何,我们还是通过比较全面的测试来看看! 首先要测试的是语言能力,通过提出各种语言相关的问题,看它们是否能够给出合理的回答;或者生成一些文本内容,看这些文本内容是否有创造力和有意义。 四个问题: 1,请用英文翻译:我今天吃了一碗酸辣粉,很开心。 2,请用五言绝句写一首描写秋天的诗。 3,请用自己的话解释什么是主谓一致。 4,请改进这段新闻标题,让其更吸引人:美国总统拜登发表演讲,谈及气候变化和新冠疫情。 讯飞星火认知大模型 ChatGPT 测试结果:在语言能力方面,讯飞星火认知大模型除了第一个问题回答出错,其他的问题都作出了出色的回答。看了ChatGPT-3.5的回答,也只有第三个问题还算可以。可能因为它是美国公司开发的吧,用英文交流的话,它的语言能力比较强,但是用中文的话就感觉差点意思了。 然后测试知识能力,也就是提出各种相关的问题,看它们可否给出正确和详尽的回答;以及分析一些情景或案例,看它们可否给出合理和有依据的分析。 四个问题如下: 1,请简要介绍一下什么是大语言模型,它有什么作用和优缺点? 2,请列举出世界上最大的三个国家,按照面积从大到小排序,并给出它们的首都和人口。 3,请解释一下什么是核聚变,它和核裂变有什么区别和联系? 4,请描述一下黑洞的形成过程,它有什么特殊的性质和影响? 讯飞星火认知大模型 ChatGPT 测试结果:在知识能力方面,ChatGPT-3.5的能力更突出一点。如果你对某个领域知之甚少,请不要轻信AI生成的答案,以免被误导。即便是ChatGPT-3.5也不是全能大神级专家,因为有时候它可能犯错却不自知。 最后测试一下它们的的逻辑能力,提出各种逻辑相关的问题,看他们的回答是否正确和高效。 四个问题如下: 1,请用Python语言编写一个函数,实现计算一个列表中所有元素的和,并返回一个数字。 2,请用数学公式表示这个命题:如果一个数是偶数,那么它除以2的结果也是偶数。 3,请根据以下线索推理出谁说了谎:甲、乙、丙三人是朋友,也是唯一的目击者。甲说他看到了凶手的脸,乙说他看到了凶手的衣服,丙说他什么都没看到。已知只有一个人说了真话,其他两人都在撒谎。 4,请分析一下这个商业决策的优劣:一家餐厅为了吸引更多的顾客,决定对所有菜品实行半价优惠,并提供免费饮料。 讯飞星火认知大模型 ChatGPT 测试结果:在逻辑能力方面,两者都有大幅提升的空间。 结语:以上讯飞星火认知大模型和ChatGPT-3.5各有优势,也都有很大的提升空间。人工智能关系到人类的未来,属于全球科研领域的前沿技术,它的发展与信息技术、计算机技术、精密制造技术、互联网技术紧密相连。合理的利用人工智能的确可以事半功倍,但是我们也要有自己的一个判断。 |
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
2022-12-16
2022-12-16
2022-12-16
2022-12-15
2022-12-15