微软公司对来自169个国家的用户进行了为期一周的必应搜索引擎新人工智能功能测试,并公布了初步结果。
微软在一篇博客文章中表示,人工智能答案获得了71%测试者的认可,新必应的AI聊天已被证明是一项受欢迎的附加功能,可以深化互动程度。该公司表示,除了特定的查询,人们还在使用具有聊天功能的必应,发现更广阔的世界,以及用来社交娱乐。
微软在新必应中整合了人工智能初创公司OpenAI 的类ChatGPT技术。微软是OpenAI的早期投资者,最近又向该公司投入了100亿美元,并加深了双方的合作。微软正在使用OpenAI的GPT语言模型的改进和升级版本。集成聊天功能的目的是让用户在对话环境中得到更完整的答案。
微软表示必应聊天机器人还有很大的改进空间。对于需要高度准确性的查询,例如财务报告,微软将需要向负责生成答案的模型发送四倍的基础数据。微软还发现,聊天机器人在15个或更多问题的较长对话中表现不佳。该公司表示:“必应机器人可能会给出重复的回答,被人暗示或刺激后,还会给出不一定有用或不符合设计基调的回答。”
研究人员和其他测试人员在网上公布了一些与必应机器人异常互动的案例,这些案例显示人工智能用到了威胁或争论的语气,或对基本事实产生了争议。微软承认有人在测试极端情况,并表示这些测试有助于改进产品。
“我们知道我们必须与社区一起在开放的环境中打造这款产品,不能只在实验室里完成,”该公司表示。