当前位置: 首页>行业 >

热点评!ChatGPT爆火, 是AI的“狂飙”吗

来源: 北京日报 | 时间: 2023-02-22 07:59:34 |

张田勘

说到最近网上最火的科技名词,非“ChatGPT”莫属。ChatGPT(Chat Generative Pre-trained Transformer)是美国一家人工智能研究公司研发的聊天机器人程序,不仅能与人有问有答,文章也写得有模有样,因此有些人称之为史上最强AI(人工智能),甚至还有人联想到科幻片中人工智能最终取代人类的情节。记得上一轮掀起舆论热潮的人工智能事件,还是2016闍lphaGo以4∶1战胜世界顶级围棋棋手李世石。今天我们就来说说以ChatGPT为代表的人工智能对当前社会发展的影响,以及其现有成果在生物科学领域的作用。


(资料图片仅供参考)

接受强化训练的生成式AI:

对接用户需求创造新内容

现在全世界都在谈论的ChatGPT是一个人工智能撰稿和聊天工具,去年11月一经推出,便在社交媒体上迅速走红,至今月活跃用户已过亿。ChatGPT能够通过学习和理解人类的语言来进行对话、回答各种问题,还能根据要求完成视频脚本、文案、论文、代码等写作任务。它的成功,源于以深度学习为代表的人工智能技术的长期积累。从属性上看,ChatGPT其实是一个大型语言模型(LLM),接受过大量文本数据的训练,能够对各种各样的问题输入生成类似人类的应答结果和反应,因此,也可以称它为容生成器。

AI需要具备3个要素:数据、算力及算法。数据是知识原料,算力及算法则提供“计算智能”以学习知识并实现特定目标。人们对AI有多种分类,以AI“能做什么工作”和“完成什么任务”作为标准,可以简单将其分为反应式AI(分析型AI)和生成式AI。

反应式AI根据预编程规则对不同类型的刺激做出反应,由于不使用内存,所以无法通过新数据进行学习。1997年击败国际象棋冠军加里·卡斯帕罗夫的IBM深蓝超级计算机就是反应式AI。

而生成式AI获得了大量数据、信息,并且经过强化训练和深度学习,以及类似于神经网络的反馈纠错机制,所以能完成很多工作,产生很多产品。用一句话概括其本质:根据用户的具体需求创造新内容。

从ChatGPT的 全 称“Chat Generative Pre-trained Transformer(生成式预训练转换器)”就能看出,它是一款可以自行生成许多内容的AI,包括各类文本、文章、与人对话、翻译、编写代码、绘画、制作视频等。

由于受各种因素的制约,ChatGPT生成的内容也有不少错误,尤其是关于社会、文化、人文、哲学、政治、经济和历史方面的内容。但是在自然科学领域,由于有公认的定律和共同的认知,如“原子是由带正电的原子核和核外带负电的电子构成的”,ChatGPT生成的内容出错率相对较少。

正因如此,虽然生成式AI在所有领域都有用武之地,但类似ChatGPT的生成式AI在自然科学领域的应用更受青睐。生物医学研究、医疗和生命科学都需要生成式AI,ChatGPT只是其中一种。

准确预测蛋白质结构:

可加快新药和疫苗研发

目前,生成式AI在生物医学领域的用途方兴未艾。生成式AI不仅能分析成千上万种蛋白质,还可以生成新的蛋白质,甚至是自然界从未出现过的蛋白质。

过去,认识和精确测定蛋白质的构型需要耗费大量的时间和精力,还未必能测得准,给药物、疫苗研发和疾病治疗造成了阻碍。如果生成式AI的结果既准确又快速,就可以知道一些病毒变异后的蛋白质结构,如新冠病毒的S蛋白变异,从而加快研发新药和疫苗的速度。

2020年,英国深度思考公司研发的阿尔法折叠2(Alpha Fold-2)有了惊人成就。这款生成式AI在2020年举行的第14届“蛋白质结构预测关键评估”大赛中大放异彩。它测定的大部分蛋白质结构非常准确,不仅与实验方法测得的蛋白质结构的精确度相同,还远超解析新蛋白质结构的其他方法。具体来说,阿尔法折叠2能在几分钟内预测出一个典型蛋白质的结构,并能够在几天内生成高精度的结构。2022年初,阿尔法折叠2又测出了2.2亿个蛋白质的结构,几乎涵盖了DNA数据库中已知生物的所有蛋白质。

2022年11月,Meta公司(前身为Facebook)奋起直追,其名为ESMFold的生成式AI软件预测了约6亿个蛋白质的结构,这些蛋白质来自细菌、病毒和其他尚未命名的微生铩K淙桓萌砑淖既沸圆蝗绨⒍ㄕ鄣�2,但在预测结构方面速度要快约60倍。

ESMFold的原理与ChatGPT基本相似,也是一种大型语言模型,只不过,训练它的内容不是自然语言,而是生物基因语言,也就是通过碱基排列的顺序和规律来检测蛋白质。

举例来说,对于ESMFold的训练,是把已知蛋白质的氨基酸序列“投喂”给它们,正如训练ChatGPT要把自然语言的词语根据语法进行“投喂”一样。自然界的蛋白质可以用20个不同的氨基酸链表示,每个氨基酸链由一个字母表示,这种训练使ESMFold对蛋白质序列有直观理解,并能理解蛋白质序列包含的蛋白质形状信息。在这样的深度学习之后,ESMFold学会了在氨基酸比例模糊的情况下“自动补全”信息。

研究团队把ESMFold应用于大规模测序的“宏基因组”DNA数据库,这些DNA来自于环境,包括土壤、海水、人类肠道、皮肤和其他微生物栖息地。ESMFold通过算法,能结合蛋白质结构和序列之间关系的信息生成预测结构。它总共预测了超过6.17亿个蛋白质的结构,只花了两周时间。而且,在6.17亿个蛋白质测试中,超过1/3的预测是高质量的,有数以百万计的蛋白质结构是全新的。

自然界酶类从无到有:

人工酶氨基酸序列变化也无损活性

生成式AI的强大还体现在可以生成自然界中没有的蛋白质和物质,为人类的衣食住行生产、提供新原料和产品。

美国一家人工智能研究企业研发了另一种生成式AI,称为人工酶人工智能系统ProGen。这是一种专门检测酶(由活体细胞产生的一种特殊蛋白质,人体内几乎所有生化反应都必须有酶参与才能完成)和生成酶的AI软件。在实验室测试中,ProGen设计的一些人工酶与自然界中发现的酶一样有效,即使其氨基酸序列与任何已知的天然蛋白质存在显著差异,也仍然有生物活性。

特定的蛋白质各有其单独的氨基酸排列顺序。研究人员把1.9万个酶家族的2.8亿种不同蛋白质的氨基酸序列输入ProGen机器学习模型中,同时提供相关蛋白质特性作为控制标签,然后让系统花费数周时间来“消化”这些信息。此后,研究人员再把信息收窄,使用来自5个溶菌酶家族的5.6万种蛋白质氨基酸序列,以及有关这些蛋白质的一些信息来对模型进行微调。

根据学习的内容,ProGen迅速生成了100万个蛋白质序列,研究团队在其中选择了100个进行测试后发现:来自5个溶菌酶家族的所有人工蛋白质均显示出活性,且73%具有抗菌功能,而在天然蛋白质中仅59%具有抗菌功能。

更令人惊讶的是,在另一轮筛选中研究团队发现,即使只有31.4%的序列与目前已知的天然蛋白质相似,生成式AI设计的酶类依然显示出了生物活性。与之相反的是,天然蛋白质如果发生任何一个突变,都有可能失去生物活性。

这些研究结果总结起来,彰显了三方面的意义:一是ProGen生成的人工蛋白质不仅可以正确表达,还展示出与蛋白质天然折叠相类似的结构;二是AI生成的蛋白质即便只有部分氨基酸序列与天然蛋白质的序列相似,也具有生物活性,但天然蛋白没有这个优势;三是人工智能可以设计出在自然界从未有过的新物质和新产品。

这意味着,如果采用生成式AI设计和生产蛋白药物、食品及生物产品(如降解塑料的产品),会更快更有效,当然其安全性还需通过进一步的研究来检验。换句话说,如果人工智能生成的蛋白质能够像自然生成的蛋白质一样,也意味着未来人工智能可以设计人类所需要的各类产品,首要的就是满足人类生存的食物和药品。

帮助诊断疾病和优生:

最终结果仍需人类审核决定

现在,生成式AI已经发展到通过图像、血液、组织扫描结果,来检测、诊断和预测心血管病、眼部疾病、糖尿病,以及结直肠癌、肺癌、乳腺癌、前列腺癌等多种癌症。

心脏病是一类严重的心血管疾病。心电图信号最常被用作筛查心脏病的工具。新加坡南洋理工大学等机构的研究人员利用一种名为Gabor-CNN的人工智能机器学习算法设计出了一种生成式AI诊断工具,能模仿人类大脑的结构和功能,使用心电图诊断冠状动脉疾病、心肌梗死和充血性心力衰竭。试验结果显示,这种人工智能有助于自动识别健康人群和不同心血管疾病患者相关的心电图信号,其准确率能超过98.5%。

癌症同样可以利用AI来诊断和治疗。对于结直肠癌和乳腺癌,现在一般是通过观察CT照片和组织切片来进行诊断。中国中南大学等机构的研究人员从中国、德国和美国的8803名受试者和13个独立的癌症研究中心收集了超过1.3万张结直肠癌图像,利用这些随机选择的图像,研究人员构建了一种AI软件来识别结直肠癌的图像。初步测试结果显示,AI软件能检测出大部分结直肠癌图片,堪比真正的病理学家,甚至在很多情况下表现得更好。当然,最后的诊断还需经过病理学家的把关和审查。

还有一个受到医学关注的领域是不孕不育。现代生活方式和环境变化造成约有15%的夫妇不育,其中精子质量差是重要的原因之一。传统的做法是对精子活检来检测质量,但这个任务如果由AI来完成会更出色。

最近上海市第一妇婴保健院研发了一种AI软件,通过深度学习和算法,可以识别精子的“面部”和不同运动形态(类似于人脸识别),操作者只需通过电脑屏幕观察即可。这套AI系统对3家医院共1000份样本进行检测的结果显示,其准确性与传统方法相同。AI软件大大缩短了整个检查过程,仅需一个半小时,而使用传统方法需要大约一周时间才能拿到报告。

这样的“智能”例子举不胜举。可以预想,人工智能的快速发展将会对许多领域造成冲击,尤其是那些创造性较低且基于行业知识或训练就可以完成的工作,如客服、动画建模、美工、翻译、低级代码开发人员等。此次风靡全球的ChatGPT让我们看到,人工智能的发展有了质的飞跃,预示了更多可能,但这种技术革新目前还只限于语言维度,并非主动意识,也不具备真正的创新能力,与科幻片中“人工智能取代人”的幻想相去甚远。

总之,无论AI应用到了什么领域,最终所获得的成果或生成的产品仍需由人来审核和决定,这才是对待AI的科学态度。

《北京日报》2023年2月22日第9版

关键词: 人工智能 氨基酸序列 天然蛋白质

 

热文推荐

热点评!ChatGPT爆火, 是AI的“狂飙”吗

ChatGPT爆火,是AI的“狂飙”吗---ChatGPT(ChatGenerativePre-trainedTransformer)是美国一家人工智能研究公司研发的聊天机器人程序,不仅能与

2023-02-22

今日热讯:燕郊开发区京东中美医院_燕郊京东中美医院官网

1、你好,看过你的问题,燕郊京东国际医院位于京东燕郊开发区燕顺路上上城三季西门。2、希望我的回答可以给你带来帮助,祝你早

2023-02-22

【天天新要闻】蓝最美发言人PO文大叹“走后门”才买到蛋

台湾出现鸡蛋荒,不少蓝营民代也陆续分享双北各区超市超商买不到蛋的在地直击画面。国民党发言人李明璇21日在脸书发文提到,昨天在百货公司看

2023-02-21

【环球速看料】涉案超27亿 内蒙古一特大虚开增值税专用发票案开庭

涉案超27亿内蒙古一特大虚开增值税专用发票案开庭

2023-02-21

【独家焦点】真爱美家(003041)2月20日股东户数1.01万户,较上期减少6.39%

近日真爱美家披露,截至2023年2月20日公司股东户数为1 01万户,较2月10日减少690户,减幅为6 39%。户均持

2023-02-21

【天天新要闻】山大地纬股东国寿成达累计减持达到1%

山大地纬(688579 SH)发布公告,2023年2月21日,公司收到股东国寿成达发来的《关于股份减持进展的告知函》,国寿成达自2023年2月3日至2月20日期

2023-02-21

快播:长安CS95 PLUS17.59万起售,2.0T+8AT,七座布局更适合大家庭出行

长安CS95(图片|配置|询价)是长安旗下的一款中大型SUV,目前迎来了改款换代车型长安CS95PLUS。作为一款中大型SUV其采用了七座布局,售价区间在17

2023-02-21

【播资讯】调解应当遵循的原则有哪些内容_调解应当遵循的原则有哪些

1、所谓法院调解的原则,是指在进行调解活动和达成调解协议的过程中,审判人员和当事人应当共同遵守的基本准则。2、根据民事诉

2023-02-21

当前要闻:iPhone手机如何设置使用搜狗输入法_iphone怎么设置搜狗输入法

1、生活中有很多实用方便的小窍门。掌握了这些小技巧,就会方便很多。现在让我们来看看!2、先在手机上下载搜索输入法app,

2023-02-21

环球播报:金融活水助力消费活力释放 重庆推出14条措施

金融活水助力消费活力释放重庆推出14条措施

2023-02-21

每日观察!韶关武江区委书记张广晖检查全区征兵复检工作

2月19日上午,韶关武江区委书记张广晖到市第二人民医院征兵体检站检查全区征兵复检工作,并就全区征兵工作开展情况进行调研。武江区委常委、区

2023-02-21

天天观热点:点赞!4小时,西安浐灞公安找到走失女孩

母女终得团圆,王女士一把将走失的女儿搂在怀里,喜极而泣的她双眼闪着泪花。2月20日,西安市公安局浐灞分局十里铺派出所民警

2023-02-21

【天天热闻】今日怎样在网上预约挂号看病_怎样在网上预约挂号

1、微信挂号打开微信App,进入微信主页,点击右上角“+”,手动输入您要就诊的医院,如:成都中医药大学附属医院。2、关注

2023-02-20

天天滚动:历下区市政工程服务中心抓实抓细安全生产各项工作

历下区市政工程服务中心抓实抓细安全生产各项工作安全无小事,责任大于天。春节过后,各工程建设单位陆续进入复工高峰期。为进一步提升市政领

2023-02-20

环球新动态:江苏发布1月份环境空气质量排名 丰县沛县PM2.5浓度相对较差

人民网南京2月20日电2月20日,江苏省生态环境厅发布了2023年1月江苏省54个县(市、区)环境空气质量排名。其中,丰县沛县PM2 5浓度相对较差,

2023-02-20

即时焦点:联想开天 N8 系列笔记本发布,搭载兆芯开先 KX-6000 国产处理器

IT之家2月20日消息,联想推出了搭载国产处理器的开天N8系列笔记本,用上了兆芯的开先KX-6000。  联想开天N8搭载了兆芯开先KX-6000系列8核处

2023-02-20

世界要闻:石头剪刀布的简笔画如何画_玩石头剪刀布简笔画

1、今天,边肖教你使用简笔画,石头,剪刀和布。让我们一起学习吧!2、首先在剪刀里画两个手指,如下图所示。3、然后在剪刀里

2023-02-20

焦点快报!媒体:陈戌源曾劝李铁退还4800万具体详细内容是什么

媒体:陈戌源曾劝李铁退还4800万今天的热度非常高,现在也是在热搜榜上了,那么具体的媒体:陈戌源曾劝李铁退还4800万是

2023-02-20

当前播报:华茂股份(000850)2月17日主力资金净买入314.10万元

截至2023年2月17日收盘,华茂股份(000850)报收于4 01元,上涨2 82%,换手率1 43%,成交量13 51万手,成交额5402 77万元。

2023-02-20

环球要闻:队报:内马尔预计伤缺2到3周,有望赶上欧冠次回合对阵拜仁

直播吧2月20日讯据《队报》报道,内马尔有望赶上欧冠次回合与拜仁的比赛。在此前对阵里尔的比赛中,内马尔遭背后侵犯,脚踝落地变形,随后球员

2023-02-20

资讯

滑板运动成青少年“新宠” “播零杯”少年城市联赛开赛

6月5日下午,在深圳大中华广场HUA广场,播零杯滑板少年城市联赛首站赛事开赛。滑板运动成为青少年们的新宠。据播零滑板课堂的小罗现场介绍

2022-08-26     
天津津门虎队教练于根伟:机会来了要冷静

天津津门虎队明天将迎来中超联赛第五轮比赛,未尝一胜的现实也让全队上下倍感压力。昨天,主教练于根伟在谈及全队问题时表示:球员们在完成

2022-06-20     
北京推出14条秋游文化线路

金秋时节,北京市文化和旅游局以赏银杏品文化为主题,推出14条“叶落的季节——漫步北京赏银杏品文化主题线路”,邀市民和游客以步行、骑行

2021-10-27     
基因编辑发力 培育高质量人源化供体猪

此次人体试验,仅仅验证了基因编辑猪克服异种器官移植的超急性排斥反应,还需解决延迟性排斥反应、消耗性血栓等问题。但通过这次试验,能更

2021-10-27     
中国经济高质量发展步伐稳健 长期向好基本面未变

在全球疫情走势和经济走势趋于复杂的背景下,中国经济巨轮将驶向何方,举世关注。2020年10月26日至29日,党的十九届五中全会在京举行,明确

2021-10-27     
南美解放者杯决赛允许近4.5万观众入场

南美洲足联主席多明格斯25日与今年解放者杯决赛对阵的两支俱乐部负责人会晤,宣布决赛现场观众人数增加到球场容量的75%,即近4 5万人。今年

2021-10-27