周三,Alphabet(GOOGL.O)旗下的谷歌重磅推出人工智能模型Gemini,包含三个版本,从简到繁分别是Gemini Nano、Gemini Pro和Gemini Ultra。
最强大的Gemini Ultra仍在接受安全测试和审查,预计将于明年初推出。该公司表示,Gemini Pro将扩展到许多任务,并且已经在Bard中得到部分应用。Gemini Nano是该模型的初级版本,旨在用于智能手机、笔记本电脑和其他本地设备。
从周三开始,智能手机和平板电脑已经可以使用Nano版本,谷歌还表示,将立即在其旗舰手机Pixel 8 Pro上启用Gemini,支持新的生成式人工智能功能,例如从电话录音中总结要点的能力。该公司表示,下周,谷歌将通过其Vertex AI和AI Studio平台向云客户提供Gemini Pro。
Gemini还将集成到Google 3月份推出的生成式AI聊天机器人Bard中,使其能够利用该公司最受欢迎的服务,包括Gmail、地图、文档和YouTube。此次推出将分两个不同的阶段进行:从周三开始,Bard已由Gemini Pro提供支持,帮助实现高级推理、规划、理解和其他功能。
Gemini被宣传为自然语言处理领域的重大进步,谷歌称其为“我们有史以来最大的科学和工程项目”。这一模型发布受到了科技界的密切关注,许多人猜测其是否有能力超越主要竞争对手OpenAI的大型语言模型GPT-4。
据了解,Gemini是一种多模式人工智能,这意味着它可以处理多种数据类型,包括图像、文本、音频、视频和编码语言,新功能还允许对可视化图表进行书面分析等功能。根据谷歌自己的研究,在大多数测量指标(包括文本、代码、图像和视频任务)上,Gemini模型的表现优于OpenAI的多模态大语言模型GPT-4。
据The Information报道,谷歌已经于9月份开始向一小部分公司分发Gemini的早期版本。一位此前测试过该技术的人士告诉媒体,该技术可能比GPT-4更具优势,因为它利用了谷歌来自消费产品的数据以及从互联网收集的信息。该人士还表示,Gemini生成的错误答案似乎较少,这是人工智能中的一个常见问题,称为“幻觉”,即生成人工智能产生的虚假或捏造信息。尽管如此,谷歌的发言人警告说,Gemini仍然容易产生“幻觉”。
谷歌DeepMind产品副总裁柯林斯(Eli Collins)表示,长期以来,我们一直希望构建新一代人工智能模型,其灵感来自于人们理解世界和与世界互动的方式——一种感觉更像是一个乐于助人的合作者,而不是一个智能软件的人工智能,“Gemini让我们离这一愿景又近了一步。”
在该模型发布之前,该公司对Gemini进行了一系列标准行业基准测试,并表示在八项测试的六项中,Gemini Pro的表现优于OpenAI的GPT-3.5模型。谷歌还表示,Gemini在通用语言理解、推理、数学和编码方面测试的八项基准中,有七项超过了OpenAI通用模型的最新版本GPT-4。该公司将发布一份技术报告,更深入地解释Gemini的模型架构、训练过程和评估。
过去一年,谷歌一直面临着重塑核心搜索业务并应对生成式AI兴起的压力。尽管该公司长期以来一直被视为人工智能研究的先驱,但一些人仍批评其管理层在AI产品方面进展缓慢。