告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

一、前言:面向用户使用场景 打造高效的生产力工具

6月9日,讯飞星火大模型V1.5正式亮相,时隔一个月后,星火大模型的各项能力获得了持续的提升,此次更新的重点正是突破开放式问答、多轮对话能力和数学能力。

在开放式问答能力上,V1.5主要对多轮对话进行了升级,可以完成特定复杂的任务能力,人机共创带来全新机会。

在逻辑推理和数学能力上,V1.5版本主要升级了包括长链条思维链推理和数理逻辑推理,比如农夫、狼、羊、菜过河问题,直线相交问题,概率问题等等,并将大模型的语言理解能力、概括表达能力结合类搜索插件,有效解决了新知识难以更新、询问问题答非所问等行业难题,在知识问答能力上有了24%的提升。

在发布会上,科大讯飞还展示了大模型在面对今年高考题目的解答能力,数学题目测试中,前十道填空题讯飞星火答对了5题,正确率50%,在包含讯飞星火、百度文心一言、阿里通义千问、360智脑、ChatGPT六组大模型数学解题能力中排名第一。

对此,今天我们就对讯飞星火认知大模型V1.5版本进行了一番全面的测试,看看它的理解能力与逻辑处理能力上究竟有着怎样的表现。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

所以,今天我们就对讯飞星火认知大模型V1.5版本进行了一番全面的测试,看看它的理解能力与逻辑处理能力上究竟有着怎样的表现。

点此进入:讯飞星火认知大模型 (xfyun.cn)

二、星火助手体验:生活、情感、工作全方位覆盖 你能想到的功能它全有

在讯飞星火认知大模型内,拥有助手市场,并按照我们的使用需求类型逐一划分,包括职场、创作、生活、学习、出行、情感、趣味、编程等共15项分类,基本囊括了我们所需的全部种类。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

在助手市场里,你甚至还能看到彩虹屁达人、尬聊终结者、废话文学等比较有意思的小助手,不仅能够满足工作和生活上的问答需求,还增添了更多的趣味性。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

另外,在大模型内,可以自定义中英文发声的银色以及背景音乐。

那么,讯飞星火认知大模型的能力到底如何呢?接下来我们按照逻辑处理能力、写作与策划能力和问题解答能力三个维度进行测试。

逻辑处理能力测试:

我们准备了两个逻辑测试题,以下是第一题。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

有口井7米深,有个蜗牛从井底往上爬,白天爬3米,晚上往下坠2米,问蜗牛几天能从井里爬出来?

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

当我们看到这种题目,首先想到的一定是设定方程进行解答,讯飞星火认知大模型的解题思路与我们相同,经过精密的计算,给出了解题的全过程,最终给到的结果也是正确的。

看来这种初中级别的数学题目难不倒大模型。

接着我们增大难度,来看第二题。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

姐姐上街买菜回来后,就随手把手里的一些零钱放在了抽屉里,可是,等姐姐下午再去拿钱买菜的时候发现抽屉里的零钱没有了,于是,她就把三个妹妹叫来,问她们是不是拿了抽屉里的零钱。

老二说:“我拿了,中午去买零食了。”

老三说:“我看到老二拿了。”

小妹说:“总之,我与老三都没有拿。”

问:这三个人中有一个人在说谎,那么到底谁在说谎?谁把零钱拿走了?

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

面对这样的推理问题,大模型先是给出了三个假设,在经过缜密的思考与推断过后,精准的给出了问题的答案,讯飞星火认知大模型确实可以避开一些诱导性的提问。

写作能力测试:

对于大模型必备的写作能力,我们主要通过职场类、生活类、编程类、营销类和点评类这几大类型进行测试。

1、职场类

在文字编辑工作中,自然少不了各类文案与稿件的撰写,有时候内容写多了,会造成精神麻木,脑子里空荡荡的,甚至有些无从下手,对此我们主要体验了大模型对周报小助理和活动发言稿助手这两项文案的撰写能力。

(1)周报小助理

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

我们只需要输入本周完成的工作,大模型会根据工作的相关内容生成一份完成的周报,将本周的主要工作内容以及可能会涉及到的其它工作内容一并展示,并列出下周的工作计划,最终还会生成本周的工作总结。

在生成的文案中,语句通顺,前后逻辑清晰,就如同真人写作一般。

(2)活动发言稿助手

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

当然,在一些会议或者重要场合,发言稿是必备的,讯飞星火大模型借着出色的文字处理能力,提供了活动发言稿撰写的功能。

只需输入活动主题,例如:业绩复盘会或者运动会开幕式,就能生成一篇完整的活动发言稿,包括前言、内容和总结,在内容中既表达了中心思想,还包含了激励的话语,把发言稿的情绪展现的非常到位。

(3)文章总结助手

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

3000多字的文章,借助大模型的文章总结助手,迅速就能生成不到300字的摘要,通过精确识别文字包含的重要信息,快速生成简明扼要的总结,剔除无用文字,提炼文案中的中心思想,而且抓重点非常精确。

2、生活类

(1)AI食神

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

如果,你不知道今天吃什么,或者不会做饭,那就试试AI食神吧!

只需要对大模型输入食材的名称,它就能生成烹饪的步骤,而且如果你输入的食材不当或者在烹饪过程中使用不到,它会自动屏蔽掉这类食材,例如:西红柿、面条、橙子,大模型会自动将橙子剔除,生成仅有西红柿与面条两类食材的烹饪方式。

(2)行游侠

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

假期如果你不知道去哪里玩,问问讯飞星火认知大模型里的行游侠小助手,说出想去的地点,它能给你生成一套完整的旅游攻略,包括交通指南、景点推荐、美食推荐、每天的行程安排以及旅行过程中的注意事项,比起翻阅大量资料和寻找大量旅行社,这不要方便得多么?

(3)心理咨询助手

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

大模型还提供了心理咨询助手,每当你心情不佳的时候,就可以拿它来当做出气筒或者倾诉者,它可以随时安抚你的心情,还会教你如何控制控制自己的情绪,称自己为认知行为疗法师,通过认知行为治疗的形式,例如深呼吸、计数等方式,帮助你走出抑郁、冲动暴躁的情绪。

有了心理咨询助手,什么不开心的事都可以向它倾诉。

3、编程类

讯飞星火认知大模型,除了面向工作、生活、娱乐方面的问题对答如流,面对编程问题也毫不畏惧。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

我们可以看到,在讯飞星火认知大模型里,包含了各式各样的编程小助手,包含了数据库管理、软件测试、软件开发、零基础编程学习等,甚至还能将Python代码转换为Java代码,跨语种编程的实用性,只有程序员才能领略得到。

我们也对大模型的代码解释与编写能力做了测试。

(1)Python代码解释

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

例如,在Python代码解释小助手内,输入一段未知的代码,它会给到我们每行语句的解释,这项功能比较适合零基础想要学习编程的同学。

如果有什么关于编程方面的问题,只要向他传输代码,立马就能生成简单易懂的注释,并在每行代码中展出,不论是单行代码还是一大段代码,它都能精确又完整地将语句解释出来。

有了讯飞星火认知大模型的Python代码解释小助手,对于自学编程的同学,不再需要到各种IT网站翻找那些若有若无,似懂非懂的编程案例,它就是你的代码翻译官,还是你的代码纠正器。

(2)星火程序员

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

除了代码的解释,利用星火程序员小助手,给它一个需求,他就能快速帮你生成一段代码程序。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

我们也把这段代码放到Pycharm解释器中去试用,程序完美运行无bug。

不过有一点比较遗憾,在生成的代码中没有注释,所以星火程序员小助手比较适合编程老手,生成的代码逻辑一看便懂,不太适合零基础的小白去使用。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

除了基础功能的代码撰写,大模型可以导入并调用Python中的各类模块,例如,让它写一个爬虫程序(受界面限制图中程序未全部展现),它会自动调用requests和BeautifulSoup这两个模块(前提是你的电脑里已经预装)。

4、营销类

在营销文案撰写方面,讯飞星火认知大模型也凸显了自己独到的优势。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

我们向内输入需要宣传的产品与关键信息,它可以在20秒以内根据信息生成主标题以及产品的宣传要领,将每个要领以标题+内容的形式展现出来,产品的各项特色一目了然,甚至还在每段标题前自动生成一个多彩mini logo,看整段文字不再枯燥。

5、点评类

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

三、星火助手创建:激发用户灵感 把你的奇思妙想带给所有人

能有如此之多的小助手,我们只能去用内置的功能,那就太没有意思了。

所以呢,讯飞星火认知大模型可以激发你的灵感,让所有人自创小助手,创造出造福大众的实用工具,想想就觉得激动呢!

那么具体要怎么操作呢?

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

在讯飞星火的主界面点击右上角的助手创作中心即可进入到创作界面。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

在创作前,我们需要先拟定好助手的名称、类型、助手回答是否需要进行上下文理解、功能描述以及助手指令。

在助手指令中,我们需要输入该助手的使用说明,例如:输入你想起的标题文本,即可输出5个文章标题。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

我们可以设定输入的内容是否需要根据上下文的理解进行回答。

调试与预览窗口

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

右侧就是我们调试与预览的窗口,我们可以在这里对小助手进行调控,如遇到问题可以及时进行修改。

主界面我创建的助手

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

当调试完成之后,我们就可以在讯飞星火大模型主界面的“我的助手”中找到我们刚刚创建的“标题小达人”助手。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

测试一下,利用华为P60 Pro的主要三大特性输出5个不同的文章标题,每一个标题都独具风味。

至此,小助手的添加操作就算完成了,我们可以将创建的小助手申请上架,让更多的人用到,当然也可以自己独享这一功能。

四、总结:告别答非所问 讯飞星火认知大模型未来无限可期

经过我们的体验,我们对这款讯飞星火认知大模型,作出以下总结:

讯飞星火大模型让我印象最深刻的地方在于,它的语言理解能力已经不再局限在文字表面和给出问题的答案,而是能够基于自然对话的方式,进行理解与执行任务,形成的文笔流畅,段落清晰,在多个领域展现出其强大的逻辑处理能力。

有了它,我们就能让复杂的问题简单化,无论是工作、学习还是娱乐,它都能为你提供个性化的建议和解决方案,让你轻松应对各种挑战。

高度的定制化,让你的奇思妙想随意发挥,大幅度降低了AI应用的开发门槛也能让创意即想即用,不仅服务自己,还能够让更多的人享受到你的成果

综合来说,讯飞星火认知大模型不仅是我们工作中的得力助手,还是我们的生活小百科,遇到任何事情都可以提前去问问它,通过的先进的深度学习算法和逻辑推理能力,不会只看问题的表面,而是透过本质去深度剖析问题,也就不会再出现“答非所问”的情况,比起用搜索引擎去逐步寻找、筛选,方便了不止一星半点。

截至目前为止,讯飞星火认知大模型已涵盖了PC、H5、App(iOS、安卓)与小程序,并可实现跨设备历史记录同步,场景无缝衔接让每个问题都能有所回答,也就是说不论你使用的是移动端还是PC端,都体验到你定制的内容和训练的成果。

6月9日,星火认知大模型已升级到V1.5版本,相比于1.0版本,在开放式问答、多轮对话和数学能力得到了大幅提升,文本生成、语言理解、逻辑推理能力持续提升。

按照官方公布的消息,星火认知大模型今年的产品规划如下:

6月9日:突破开放式问答、多轮对话能力再升级、数学能力再升级。(已完成)

8月15日:突破代码能力、多模态交互再升级。

10月24日:通用模型对标ChatGPT (中文超越,英文相当) 。

如今,科大讯飞的应用正渗透到各行各业之中,展望未来,讯飞星火认知大模型会不断创新和完善自己,无论你是想提升工作效率,还是追求更高品质的生活,它都能为人类带来更多的便利和惊喜,甚至彻底改变人们的生活和工作方式,成为未来科技的代表之一。

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

【本文结束】如需转载请务必注明出处:快科技