体验了一把「讯飞星火V2.0」,真的惊艳到我了!
共 5173字,需浏览 11分钟
·
2023-08-23 15:40
自ChatGPT爆火后,我开始关注国内国外的AI技术突破、应用落地。起初我还抱着猎奇心理半夜翻墙抢占waitlist,后面看到了越来越多优秀的开源项目,更是见证了国内大模型的迅速崛起。慢慢地,这些都点燃了我对AI的热情。
前几天,《麻省理工科技评论》对国内的讯飞星火、百度文心一言、商汤商量和阿里通义千问四款主流大模型进行了深度评测,结果显示:「讯飞星火」以总分第一(81.5分)的成绩登顶,荣获“最聪明”的国产大模型称号。
2023年科大讯飞的关键里程碑已完成大半,它的成长有目共睹,一步一个脚印:
科大讯飞正式发布「讯飞星火认知大模型」。
“讯飞星火认知大模型”迭代升级:突破开放式问答,实现多轮对话能力再升级、数学能力再升级,发布「讯飞星火认知大模型V1.5」,“星火”App及小程序。
“讯飞星火认知大模型”迭代升级:突破代码能力、实现多模态交互再升级,发布「讯飞星火认知大模型V2.0」,两款应用产品:智能编程助手 iFlyCode 1.0和讯飞智作2,星火助手。
通用大模型要对标ChatGPT能力,实现中文能力超越、英文能力相当的目标。
8月15日,科大讯飞举办「讯飞星火认知大模型V2.0」升级发布会,星火大模型迎来代码能力和多模态能力升级。
我们具体来看下:
「讯飞星火V2.0」对代码能力进行5个维度的升级,包括:代码生成、代码补齐、代码纠错、代码解释、单元测试生成。
我尝试让「讯飞星火2.0」用Python画红色的心形线、画出马鞍面方程三维立体图并设置渐变色、用Python生成贪吃蛇小游戏,都是小case。
我觉得贪吃蛇这款游戏,大模型应该烂熟于心了,基本不会出错的。但是对于其他经典的小游戏比如飞机大战,24点,扫雷等,并不能一次输出正确的代码,可能需要你多次调试,会有不少bug比如缺失背景图片、少定义变量、没有加载库、字符格式错误等。以下是一个简单的24点小游戏的开发:
图注:输入:请用Python生成一个通过加减乘除操作的24点棋牌数学小游戏,可以使用pygame库
根据OpenAI构建的代码能力公开测试集HumanEval,「讯飞星火V1.5」 Python语言的效果只有41分,「讯飞星火V2.0」已经到了61分,接近ChatGPT。另外,根据认知智能国家重点实验室构建的代码真实的场景使用测试集,「讯飞星火V2.0」在代码生成和补齐维度上已经超过了ChatGPT。
科大讯飞还发布了讯飞星火的应用级产品——智能编程助手iFlyCode1.0。对于“零编程基础”的小白,也能轻松定制开发。
在多模态能力上,讯飞星火在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级。
在图生文上,我分别测试了「讯飞星火V2.0」对人、物、景、二次元方面的识图能力,效果还是很不错的,底下还有一键文字转语音功能,可以直接听小姐姐介绍图片内容。
不过对于文生图,当然也不是硬与SDXL和Midjourney去比较,「讯飞星火V2.0」生成的图片能够完整表现文字,甚至一些抽象的形容词如“精雕细琢”、“巧夺天工”把握的也很精准呢,未来在构图、细节、美感、色彩等方面还可以更精进。
除了强大的多模态功能以外,讯飞星火还上线了3种实用的插件:文档问答、PPT生成、简历生成。
我也申请了「讯飞星火V2.0」的API内测,在讯飞开放平台申请一个应用ID:智能人群分析。参照《人脸识别-人脸特征分析》开发文档,简单的配置,就能做基础人脸信息的解析。
小试牛刀,我尝试了表情识别,上传人像图片后就能输出如下所示的表情识别结果。调用API响应很快,过程流畅,个别小问题参照错误码查询库能马上解决。
「讯飞星火V2.0」的更新不止于此,还有适应生活与工作场景刚需的「星火助手」,据官方介绍目前已开放2000+个智能助手,覆盖了创作、营销、编程、学习与旅行等十余个核心场景。
太多了,我也只能挑选一些自己感兴趣的“小助手”去体验。从几天里对「讯飞星火V2.0」的使用和测试,我谈不上全面,但值得肯定的是讯飞星火团队真的很用心地去做模型、去研发产品。
虽与GPT-4还有差距,但在国内「讯飞星火V2.0」绝对是一个不可替代的中文大模型,性能抗打,有着绝对的优势。
第一,讯飞星火的注册过程超简单,不到1分钟就申请好了。
第二,讯飞星火的响应速度超快,每条内容平均生成时间不超过5秒,非常丝滑!相比ChatGPT和一些国内产品,体验时经常会因网络卡顿等原因不得不刷新页面重新提问。
第三,讯飞星火免费内测,包括星火APP、星火API、星火助手、星火插件等全线应用,诚意满满啊。
新人福利!我还向在讯飞星火的朋友申请了一个专属链接(二维码):
https://xinghuo.xfyun.cn/?ch=bl_WiBixO
通过这个专属链接申请内测体验的,审核更快,秒通过哦!!!
长按内测二维码,点击“申请注册”即可。
还没有体验过「讯飞星火V2.0」的小伙伴,强烈建议通过专属链接(二维码)来申请。
想要进一步探索讯飞星火的大模型能力的开发者,特别是智能语音方面的小伙伴,一定不能错过讯飞开放平台的新手大礼包了!个人用户就有5万次的免费语音听写交互使用量,企业用户则有50万次的免费使用量。