香港脉搏www.etnetchina.com.cn
 理财/管理智城物语
打印logo打印本文章电邮logo字体:
分享:
GPT-4智商更胜ChatGPT!输入图片即可生成内容
方展策
作者:方展策评论评论:点击率点击率:

发表时间: 2023-03-20 17:20:13

作者介绍

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

   背靠GPT-3.5大型语言模型的ChatGPT,2022年11月底面世后有如一石激起千层浪,令生成式AI热潮席卷全球。想不到短短4个月后,AI研究实验室OpenAI便释出第四代模型“GPT-4”,技术上进一步抛离其他大型语言模型。微软亦随即宣布,Bing搜索引擎已同步采用GPT-4,让Google在AI搜寻赛道上瞠乎其后。到底GPT-4比起GPT-3.5有何改进之处?功能更强大的GPT-4又是否一个已臻完美的AI模型呢?


第一代GPT模型2018年诞生


   ChatGPT名字中的“GPT”,是“Generative Pre-trained Transformer”的缩写,中译为“生成式预训练变换模型”。这是由Google Brain研发出来的深度学习模型架构,专用来处理自然语言;OpenAI正以此为基础,创造了GPT模型,迄今已经历四代演进。


   第一代GPT模型于2018年6月横空降世,能够判断两个句子之间的语意和关系、对文本数据进行分类、并能够解答一般常识和推理问题,但当时模型接受训练的数据参数仅有1.17亿项,相对较少,所以不算是好的对话式AI模型。


   第二代GPT-2模型是基于初代模型直接扩展而成,可说是GPT-1的加强版。它在2019年2月发表,被定位为“通用型AI”,不针对单一知识领域进行专门训练,而是学习各式各样的常识,训练参数达到15亿项,是上一代的10倍以上。GPT-2已能够回答问题、翻译文字,并生成文本输出。它输出的文字开始近似人类语气,惟生成较长段落时却可能出现重复或无意义的内容。


GPT-3.5搭ChatGPT掀热潮


   来到第三代的GPT-3,训练参数较GPT-2暴增117倍,超过1,750亿项,技术上也有飞跃进步,2020年6月释出给开发者试用。它能够辨识数据中隐藏的含义,并运用从数据训练中获得的知识来执行任务;换言之,就算要处理从未接触过的事物,它也能够理解并作出适当的响应。


   GPT模型发展至第三代,终于展现出商业应用上的实用性。可是,2020年正值新冠疫情高峰期,此AI技术突破并没有引起社会的太大关注。再者,GPT-3不像ChatGPT般能够输出自然对话,所以只有部分开发者和厂商对它感兴趣。同年9月,微软(Microsoft)宣布取得GPT-3的独家授权。


   2022年11月底,OpenAI发表GPT-3的优化版本“GPT-3.5”,并搭配聊天机械人“ChatGPT”一并推出,凭着其接近人类对话与思考方式的特点,瞬即吸引全球目光,掀起生成式AI热潮。GPT-3与GPT-3.5的主要分别在于,前者只是搜集和使用互联网上的数据进行训练,后者则会利用人类的响应和反馈,执行强化学习来自我训练。


GPT-4可处理2.5万字长内容


   距离ChatGPT爆红还不到4个月的时间,Open AI于2023年3月14日突然发布更具突破性的GPT-4,开放给ChatGPT Plus付费订户和软件开发者使用。OpenAI没有披露GPT-4模型受训参数的数量,只表示2022年8月已经完成训练,之后便不断进行微调改进,务求令其数据处理与理解能力大幅提升。


   GPT-4能够处理多达25,000字的内容,足足是GPT-3.5+ChatGPT的8倍以上。它容许用户输入更长内容,进行长篇文章翻译或编写摘要。更重要的是,这样意味着GPT-4拥有更强的记忆力。


GPT-4最实用的改进之处是,把文字输入限制提高至2.5万字,所以能够理解更长的上下文,作出更准确的回应。(图片来源:翻摄OpenAI官方YouTube影片)


   其实,ChatGPT有时表现不佳的主要原因是,用户最初提出的要求,在一定长度的谈话后,便会被后来的对话内容所覆盖,让AI无法把握完整的上下文来作出分析,致使回复偏离讨论主题。因此,当GPT-4能够记住25,000字的内容,AI就能够长时间监看与用户的对话内容,给出更精确的答案。


GPT-4能解读图像再作出回复


   更教人惊喜的是,GPT-4已升级为多模态(Multimodal)的AI模型,同时支持图像与文字输入来生成内容,打破ChatGPT只能键入文本提示的限制。它能够在理解图像内容后,给予用户建议,达到“看图说故事”的效果。


用户可以向GPT-4输入图片,要求响应。例如以下图片显示了鸡蛋、面粉、牛奶等食材,它在分析图片后,便会告诉用户利用这些食材可以制作什么甜品。(图片来源:OpenAI官网)


GPT-4被问到假如剪掉以下图片中的绳子,将会发生什么事?它懂得回答图中的气球将会飞走。由此可见,GPT-4在理解图片内容后,已能作出逻辑推理。(图片来源:翻摄OpenAI官方YouTube影片)


   在GPT-4上输入的图像可以是相片、图表、屏幕截图、甚至是手绘草图。OpenAI共同创办人格雷格•布罗克曼(Greg Brockman)在GPT-4的直播演示中,拍摄其笔记簿上一幅手绘的网页设计草图,然后上传至GPT-4,AI随即生成对应的网页程序代码。他认为,这将会大幅改变网站设计模式。


OpenAI共同创办人Greg Brockman输入一张手绘的网站设计草图,GPT-4即能自动生成网页程序代码,网站接口布局几乎跟手绘草图一模一样。(图片来源:翻摄OpenAI官方YouTube影片)


   此外,GPT-4甚至连迷因恶搞图也能够解读。例如,一幅来自Reddit讨论区的恶搞图,显示iPhone插着VGA连接器,GPT-4能够辨识并描述图片的幽默之处:将旧款VGA连接器插进新型智能手机是很滑稽的。目前GPT-4图像输入功能仍处于开发者预览版本,暂不对外开放,OpenAI未有透露开放时间表。


GPT-4能够解读以下恶搞图的内容,准确地指出过时的VGA连接器插入新型智能手机的充电端口,是滑稽之举。(图片来源:OpenAI官网)


GPT-4律师资格考试名列前茅


   除超凡的理解能力外,GPT-4更拥有优秀的推理能力。OpenAI声称,GPT-4在很多专业考试的表现已直逼“人类水平”(Human-level Performance)。为求证明此事,OpenAI安排GPT-4参加多项人类考试,包括律师资格考试(Bar examination)、美国大学入学的SAT测验、以及国际生物奥林匹克(International Biology Olympiad)等,结果统统交出骄人的成绩单。


   OpenAI表示,GPT-4在律师资格考试中的答题表现位列前10%,即是可以胜过90%的考生;GPT-3.5的成绩则落在后10%。GPT-4在SAT阅读考试中成绩位居前7%,在SAT数学考试中则排名前11%。至于在生物奥林匹亚竞赛中,GPT-4的成绩排名更高踞前1%,击败99%的参与者。


   为测试GPT-4的语言水平,OpenAI利用Azure Translate把评核AI理解能力的“MMLU”基准检验翻译成不同语言,让GPT-4作答。结果发现,GPT-4英文答题的正确率高达80.5%,中文答题正确率亦达到80.1%,日语和韩语答题正确率则为70%至80%,可见GPT-4展现出极高的多国语言能力。


MMLU(Multi-task Language Understanding)基准考试包含14,000条试题,涵盖STEM、人文、社会科学等57个学科。结果GPT-4几乎以10%以上差距击败其他大型语言模型,包括Google旗下的PaLM。(图片来源:OpenAI官网)


GPT-4仍有幻觉,不完全可靠


   纵然GPT-4在技术上已有长足进步,但OpenAI执行长山姆•奥特曼(Sam Altman)却坦承,“它仍然是有缺陷的。”GPT-4依旧有GPT-3.5的“幻觉”(Hallucination)问题,有时会捏造信息,生成与事实不符的回复;即使有用户指出其答案出错,GPT-4会倾向坚持自己是对的。


在SAT、GRE、AP等公开考试中,GPT-4大部分的成绩(绿色部分)均优于GPT-3.5(蓝色部分)。(图片来源:OpenAI官网)


   不过,OpenAI强调,他们额外花了6个月时间来调整模型,并在数据训练过程中纳入更多人工回馈训练,以减轻GPT-4的幻觉问题。在OpenAI的对抗性测试评估中,GPT-4陈述事实响应(Factual Responses)的可能性提高40%,回答不允许内容请求的可能性则降低82%。因此,GPT-4比起GPT-3.5算是较为可靠,但OpenAI仍警告不宜尽信GPT-4给出的答案。


   GPT-4的另一缺憾是,其受训数据也像GPT-3.5般只更新至2021年,对于这个时间点以后的事情,它就无法作出响应。幸好,OpenAI发表GPT-4后不久,微软便宣布Bing AI搜索引擎已同步升级使用GPT-4模型。大家只要透过Bing向GPT-4提问,它也能够回答2022年或以后发生的事情。


AI市场规模超过3,000亿美元


   OpenAI在短时间内推出功能更强大的GPT-4模型,代表着其开发团队正以极高速度引领AI技术变革,迫使Google等竞争对手要投放更多资源来奋起直追。这样有助加快AI的研发进程,并造就市场百花齐放的局面,实现AI全面普及。


现有ChatGPT用户如想体验GPT-4的强大功能,只要升级为ChatGPT Plus订户,乖乖付上20美元(约156港元)的月费便可以了。(图片来源:OpenAI官网)


   根据OpenAI提供的资料,美国投行摩根斯坦利(Morgan Stanley)现已运用GPT-4来整理金融数据,电子支付方案商Stripe亦尝试用GPT-4协助打击诈骗;同时,网上教育机构可汗学院(Khan Academy)、网上语言学习平台Duolingo、以及冰岛政府也有使用GPT-4来辅助营运。由此可见,生成式AI已开始在企业和政府逐步落地应用。


投资顾问经常要浏览大量金融数据,以回复客户提问,但这样做却相当费时失事。因此,摩根斯坦利现正探索如何利用GPT-4来整理金融数据,以提高分析效率。(图片来源:OpenAI官网)


   国际市调机构IDC分析指,引进AI速度较慢的企业,无可避免地会落后于竞争对手。IDC预估,2023年全球对AI系统的支出将增加27%,达至1,540亿美元(约1.2兆港元);之后每年增长率将维持27%,及至2026年总支出可望超过3,000亿美元(约2.3兆港元)。


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。

分享:
返回智城物语
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  只看作者评论  查看全部评论:↑顺序 ↓倒序
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序 ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目