实测百度文心一言:虽未超预期,但也绝非段子手们调侃的那般不堪

关注
当然
广东电子商务
一个移动端的服饰社交电商
最近融资:|2016-01-28
我要联系

文|邻章

3月16,百度正式对外发布了生成式人工智能产品——文心一言。

坦率而言,业内对百度这款产品期待颇高,毕竟在某种程度上它寄托着国内人工智能迎战Open AI ChatGPT的希望。

而颇为巧合的是:在文心一言发布前夕,本就光环加身的ChatGPT再次迎来语言模型大更新,从原本的GPT—3.5进化到了GPT—4,在众多功能层面实现了能力飞跃。

这无疑让百度文心一言还未面世就压力倍增。

也或正是基于此,在文心一言发布前夕,网络上就有许多看衰文心一言的恶搞段子出现,借此看衰百度文心一言。

而回到昨日百度文心一言的发布会现场,由于现场并未进行实际能力的实际演示,而是采用了录播的形式,这在某种程度上或许进一步加深了外界对文心一言实际能力等质疑。

受此影响,百度股价昨日也一度大跌9%。甚至于大家随后的讨论点,都转移到了厂长的身材保持、衣品等层面去了。

这无疑是偏离了航道。

事实上,我们最应该关心的问题,应该是百度文心一言的实际能力究竟怎么样?

这需要实际体验之后再给出答案,正所谓没有使用就没有发言权。

但遗憾的是,当前许多人在评价文心一言时,其实并未有过实际的上手体验,所以评价也难免不客观。

当然,这也这也与百度文心一言在当前并未全面开放用户使用有相当关系。

当然,较为幸运的是,个人拿到了文心一言的首批内测资格,也随即对百度文心一言进行了实际测试。

以下是个人对百度文心一言能力的实测截图。

(1)词义理解

(2)玩梗

(3)程序编写

(4)提纲撰写:

(5)文章撰写

(6)计算与时事回答

(7)AI绘画

从总体测试结果来看,百度文心一言能够完成文学创作(通知、新闻稿、文章撰写),数理推算(部分)、中文理解、绘画创作等任务,但同时也存在对问题回答似是而非、无法总结要点,对部分时事内容无法回答等问题(这应与训练数据有关系)。

所以综合而言,个人认为:虽然文心一言整体表现并未超预期,但也远不是段子手们嘲讽的那般不堪。

也或正是基于更多用户对文心一言进行了实际测试,对其能力有了实际了解,当下市场对百度也实现了信心恢复。

这从今日百度股价大涨15%,就很能说明问题。

写在最后:

千里之行始于足下,而百度文心一言已经迈出了步伐,虽然谈不上完美,但纵观业界,即使是ChatGPT也是经过几轮的发展才有今日之表现,所以在此我们也不妨多给百度文心一言一些成长时间。

反馈
联系我们
推荐订阅