微软支持的创业公司openai本周推出了gpt-4人工智能模型。作为chatgpt背后人工智能模型gpt-3.5的下一代技术,gpt-4相比于之前更加强大。
其中最重要的是,gpt-4具备“多模态”能力,这意味着它可以同时基于图像和文本输入生成内容。
01
gpt-4和gpt-3.5有什么区别?
gpt-3.5只能接受文本输入,而gpt-4还可以使用图像作为输入信息,识别图片中的对象并进行分析。
gpt-3.5做出的回答被限制在约3000个单词,而gpt-4可以做出超过2.5万个单词的回答。
gpt-4在回答中出现不允许内容的可能性比上一代技术低82%,在某些事实性测试中的得分则要高出40%。
gpt-4还支持开发者定制ai对话的语气和风格。例如,gpt-4可以采用苏格拉底式的对话方式,用问题来回答问题。而上一代版本在回答中采用固定的语气和风格。
openai也表示,很快chatgpt用户就可以选择聊天机器人的语气和回答风格。
02
gpt-4有哪些能力?
gpt-4在美国律师考试和gre考试中的表现超过了上一代技术。openai总裁格greg brockman在演示中还展示了gpt-4如何帮助用户计算税款。
此外演示显示,将手绘的网站框架照片输入给gpt-4,gpt-4就可以生成一个真实的网站。
面向视障人士的应用be my eyes则将在应用内提供一个基于gpt-4技术的虚拟志愿者工具。
03
gpt-4有什么局限性?
根据openai的说法,gpt-4与此前的版本有类似的局限性,并且“在许多真实世界场景中的能力不如人类”。
对包括gpt-4在内的许多ai模型来说,产生“幻觉”,做出不准确的回应一直是个挑战。
openai表示,gpt-4在很多领域都可以匹敌人工宣传,尤其是在与人工编辑合作时。在被问到如何让对话双方产生分歧时,gpt-4提出了看似合理的建议。
openai首席执行官sam altman表示,gpt-4是“最有能力、最能符合”人类的价值观和意图,但“它仍然存在缺陷”。
gpt-4仍不了解2021年9月之后发生的事件,因为在训练时没有输入这部分数据。它也不能从经验中进行学习。
04
gpt-4都有什么应用?
虽然gpt-4可以处理文本和图像输入,但chatgpt plus的付费用户和软件开发者目前仍然只能使用文本输入功能,并需要排队等待。同时,图像输入功能尚未公开发布。
openai的付费套餐于2月份推出,每月收费20美元。购买该套餐可以获得更快的响应速度,并优先获得新的功能和优化。
gpt-4目前支持微软的必应ai聊天机器人,以及语言学习平台多邻国付费套餐中的一些功能。
文章来源:新浪科技