字节的豆包怎么样?
共 2094字,需浏览 5分钟
·
2023-08-23 13:46
字节上线了自然语言对话大模型产品,取名「豆包」。
按照字节的一贯风格,不知道这个名字是不是靠数据洞察出来的,但我总觉得有点怪怪的,可能是还不太习惯的原因。
目前产品已经可以开放注册了,你可以进入豆包官网使用抖音账号直接登录。
进入产品后,默认会给你提供四个对话窗口,第一个是豆包本包,后面依次是英语学习助手、聊天小宁、以及写作助手。
区分出来的这四个场景应该是有做一些提前参数预设,满足不同情况下的用户需求。
我分别测试了一下豆包在不同场景下的回答表现,一个总体感觉就是预期之中,但没有什么惊喜。
如果和 GPT-4 相比的话,还是有不小差距。
其实不只是豆包,目前国内各大厂商推出的对话式大模型产品和 OpenAI 的水平相比也依旧有差距。
我同时对比了豆包、文心一言以及 ChatGPT 在同一类问题上的表现,对于一些常规简单问题来说,大家的差距其实不是很大,回答的都是标准答案。
如果涉及一些数学计算或者逻辑性问题的话,明显感觉基于 GPT-3.5 以及 GPT-4 的 ChatGPT 更准确。
不过关于一些事实性错误的回答,其实各家目前也都存在,只不过程度不一样。
我觉得对于这类产品来说,更重要的还是和实际场景结合所产生的效率提升和价值创造,只不过现在绝大多数人还处于体验尝鲜阶段。
作为搜索引擎的潜在替代者,自然语言对话大模型显然还不具备完善的属性,至少在即时性上依旧有短板。
我问了豆包两个关于即时性的问题,它都没能给出回答。
其实类似的需求如今已经可以通过搜索引擎满足了,如果 AI 语言模型产品能满足,且能给出更具体的参考信息和行动指南,那效率就比搜索引擎高出不少,毕竟后者还需要用户去筛选。
不过把它们当做知识总结、建议咨询、效率创作工具的话,如今确实已经能升任生产生活工具。
如果你把这类产品当做一个学习工具,其实也是一个很好的应用场景,因为知识都是既有信息。
比如,我问了豆包一个关于产品需求优先级的问题,它的回答其实就比较全面。
说实话,现在的状态有点像一二十年前的互联网,当时大家都想做搜索引擎,然后又都想做电商,接下来又都想做社交网络。
结果也很明显,基本都是一家独大,其余玩家要么放弃要么优势互补。
不知道如今关于大模型的竞争结果会是一个怎样的状态,但现在的确有点百家争鸣的意思。
说不上谁更好,因为基础体验大差不差,没有惊喜,也没有失望。
当然,我觉得这类产品优先发挥价值的地方并非 C 端领域,而是对生产效率要求更高的企业服务和职能工种,比如文案创作、翻译、审核等岗位。
那问题来了,这些人会失业么?
显然,当效率提升后,原本的人员需求量一定会减少,10 个人干的活儿现在可以由 1 个人干,这是效率提升带来的。
但是,工具也需要人使用,掌握新生产力工具的人会成为优势占有者。
所以,一定会有人失业,但也一定会有人重新获得职业竞争力。
对于产品经理来说,这也会是一个提升工作效率的工具,但对于思考性和决策性的工作,技术依旧无法在短期内取代人。
但总有一天,我们也会迎来挑战和危机。
技术进步,不会给任何人留下面子。
如果你们还没体验豆包的可以直接进他们官网 doubao.com,感兴趣的可以同时打开其他家的同类产品,然后用同一个问题去测试。
今天七夕,或许你可以考验它几个人生终极问题。