当前位置: 首页>行业 >

对话圆代码 CEO 张朝明:做不跟 ChatGPT 对抗的企业大模型,用更少的数据达到更好的效果

来源: 雷锋网 | 时间: 2023-05-31 10:18:04 |

通过统一的自然语言指令调用大量知识,ChatGPT 改变了人与 AI 交互的方式,并将进一步改变更多软件的交互模式和底层架构。

例如,现实生活中,各行各业都与海量的数据处理有关,比如把企业的季度营收数据填进报表中,记录证券市场交易数据和市场趋势波动,处理保单医疗图文数据等等,但将数据从非结构化的图文信息中抽取、整理出用户需要的信息,往往需要耗费相当的人力和时间。

近日,《连线》杂志创始主编 Kevin Kelly 在接受媒体采访时表示,他很认同一个观点,就是:在未来,人们需要放大自己身上 10% 的技能,因为剩下的 90% 将被 AI 取代。例如,在医疗领域中,AI 特别擅长搜索和分析,可以协助人类医生进行诊断。


(资料图)

业界对大模型的需求呈井喷之势。基础大模型的优势在于它的通用性,通过强大的图文理解能力和交互方式,目标在于追求最终的通用人工智能(AGI),但与此同时,通用大模型在满足阶段性的、细分场景下的 B 端需求上也体现出 " 牛刀小用 " 的短板,在工程优化、降低成本等方面有很大的提升空间。

对于这一问题,近日 AI 科技评论与深圳市圆代码互联网有限公司的 CEO 张朝明进行了探讨。

张朝明指出,今天的大模型有非常强的话语权,甚至可以决定一个生态的生死;从资金、技术和人才等角度体系思考,创业公司入场的门槛正在降低。小公司要参与大模型的浪潮,张朝明认为最大的机会还是在 To B 市场上。

" 首先,不是去做一个跟 ChatGPT 对抗的大模型,而是聚焦私有化部署,做一个具备行业 Know-How 的企业大模型;第二,ChatGPT 给出的结果是对是错,需要交给专业的人用专业的知识去判断。"

以下是 AI 科技评论和张朝明的对话:

大模型也需要专业知识参与

AI 科技评论:您怎么看小公司在大模型产业变革中的机会?

张朝明:今天大模型在任意领域的问答生成表现都非常好,但它在需要专业知识的领域问答上还是有不足之处的。专业知识的数据在网上不好获取,训练也就不够充分。

比如保险行业中的核保,关于核保的规则往往很难在公开渠道中获取,这属于保险公司的核心机密,我们只能通过在案例里去学习,因此也就存在不够精准的问题。大模型在专业知识领域大概只能做到百分之六七十的准确率,外行人看着可能觉得效果不错,但在内行人看来是无法使用的。

在行业里,95% 是一个生产标准。什么意思?也就是说做到 80% 也好、70% 也好,对生产环节而言没有区别。行业的判断标准之所以是 95%,是因为人的准确率大概在 92% 到 98% 之间,95% 刚好是个中位数,差额的几个点默认是人为也会出现的损失,这是一个容忍度的问题。而越在生产环节,对模型效果准确率的容忍度越低。

在 To C 的场景里,比如娱乐行业、泛娱乐场景,我们用 ChatGPT 聊天、写文章、生成图画、写文案,达到 60% 就觉得效果非常好、很满意,但进入金融行业或其他一些行业,没有 95% 准确率,基本上可认定为它没有任何意义。因此在生产环节里,模型的生成是容忍度非常低、但精度效率要求非常高的一件事情。

我们能看到的一个趋势是,大模型在 To C 方面很难超过 ChatGPT,这是由 To C 特殊的环境决定的,当一家中国企业做出一个 ChatGPT 后、美国人会不会使用,这是个很重要的问题,这也从语料、用户数量等等方面决定了国内厂商的模型很难达到 ChatGPT 的水准,但中国人自己使用是可以实现的。我认为 ChatGPT 和以前的淘宝搜索等不一样的地方在于,它是跨语言的。以前在淘宝上想使用英文搜索、或在谷歌上使用中文,都存在语言问题,但 ChatGPT 很好地处理了跨语言的问题。

因此,最大的机会还是在 To B 的市场上。

首先,不做一个跟 ChatGPT 对抗的大模型,我们看到的市场是在私有化部署上,具备行业 Know-How 能提供专业知识结果的企业大模型。私有化部署解决的是两个问题,一个是数据隐私的问题,这是私有化部署的核心,另一个则是专业性,所以这个大模型用户要自己训练;ChatGPT 给出的结果是对是错,需要通过人专业的知识去判断,且无法矫正数据的准确率,并不是将专业知识灌进去,就可以得到专业的结果,因此,企业也需要训练自己的大模型。

AI 科技评论:用小模型来实现 95% 的生产标准和用大模型来做,思路差异是什么?

张朝明:它是两个概念。小模型的优势是,它是在专业领域里一定是超过大模型的,知识图谱对知识的提炼和数据的获得,都属于小模型的优势,而大模型的优势在于它 60% 左右的通用性。比如说我想写一篇调查报告,写一个调查报告框架描述这件事、肯定是大模型写的好,但里面数据的填入是小模型更专业。所以这件事情需要大模型配合小模型来完成。

AI 科技评论:大模型配合小模型来完成,这么做的核心逻辑是什么?

张朝明:在大模型还没有起来之前,人们很难看到行业知识图谱背后的价值,只看到了完成它所需要付出的巨额成本。直到大模型火爆后,知识图谱成为了生成报告的数据内容,可以为多轮问答提供支持等等,才展现出它的价值。

从商业逻辑上看,在仅用小样本就能完成一个行业知识训练的情况下,使用几个亿、几十个亿的成本来训练行业知识的人、即便将这部分成本平摊到各个业务环节中,也肯定是赔钱的。核心的逻辑就在于,知识整理、储备整理和这个成本是多少?而这件事情过去很少有人去做。

过往知识图谱很多只能售卖一次,但好的商业模式应该具备可持续的续费能力。小模型的问题在于它构建知识图谱的成本太高。当一个做小模型的公司,构建知识图谱需要花费高达一两个亿,就又回到了不挣钱这件事。而大模型提供的能力是,写文章的时候让你怎么写得更优美、问答更通顺,而核心的知识来源一直没有解决。也就是说,无法使用大模型来指导工作,因为成本太高了。

为此,圆代码之所以能够极大地减少成本开支,是基于我们从小模型时代就基于自研技术、所提出的核心抽取模型。通过核心抽取模型所具备的复杂语义抽取能力,可实现用小样本解决构建知识图谱的成本问题。

AI 时代需要新的 " 操作系统 "

AI 科技评论:圆代码所做的是提供基础大模型,还是帮助客户训练大模型?

张朝明:我们提供的是一套基础的东西。前几年零代码特别火,但其大家都非常清楚它的价值有限。在我看来,它并不是一个跨时代、变革的产品,而只是在原有生态体系下减轻工作量的一个工具,难以使用它跨任何行业去做无代码,但现在 AI 我们认为它已经是一个全新的生态。

PC 时代是操作系统为王,到互联网时代浏览器成为了入口、入口为王,再到移动互联网时代又是操作系统(iOS 和安卓)为王,发展路径十分清晰,非常简单的道理是、操作系统没有强势地位就会被剥削掉。

因此我们认为,大模型跟零代码的区别就在于,大模型一定是个基础设施,有非常强的话语权,甚至可以决定一个生态的生死。我们想做的就是一套操作系统,任何玩家都可以用,我们把这套东西提供给企业,企业的人不需要会编程,而是只要会业务、把他的业务数据放到这套东西上就可以使用,任何领域的人都能非常简单地完成相应的工作,这是我们对这套 " 操作系统 " 的定义。

比如一个公司要做研报解析,需要派 100 个人完成这件事,现在交给了 AI 公司,但如果 AI 公司也需要用 80 或者 90 个模型工程师来完成这件事情时,那么它所发生变化很小,赔钱的人从原来的公司变成了 AI 公司,这是一个核心的问题,只有解决了它,AI 公司才能够是赚钱的。

解决问题的关键在于,怎么通过使用我们所提供的这套操作系统,让 AI 公司仅需要用 1 个模型工程师和算法就能把问题解决到 95% ,这才是有价值的。

AI 科技评论:圆代码目前客户群体主要是哪些行业?

张朝明:目前我们只聚焦教育和医疗保险两个行业。

以医疗为例,圆代码做的主要对病例报告的解析,但我们不对影像报告的内容做解读,而是解析影像报告解读出来的文字内容。这部分需求放在医疗行业里,很难看到它的生态,但保险行业对这部分内容的需求很大。用大模型做医疗的事情,把保险行业的需求平移、解决保险人员对报告数据的需求问题。

跟银行不同,银行大多数的数据都是结构化的,因此在日常的运转过程中对数据解析的需求并不大。银行在正常运转下,使用 IT 软件就能处理 90% 左右的事情,剩下 10% 是由人在处理,例如贷款审核等等,因此报告解析在对应的工作内容体量中非常少。而保险公司从一开始就是人为处理的事情居多,其业务内容中人为占比达到 90% ,AI 只支持 10% 的信息存取、数据的流转,根本原因是,二者的数据源不一样,一个就是结构化的数据,一个就是非结构化的数据。

当 AI 巨大变革来临,或许银行在审核环节也会有变革,但其绝没有 AI 对保险行业的影响直接。

AI 科技评论:有了体检报告和这个表格之后的话,圆代码会对数据进行解析,那是否会进行下一步的分析处理?

张朝明:我们不进行下一步的分析处理,因为能处理这些数据的人全国能找出来不止 1 万个。但是能将这些数据它进行结构化、给到这 1 万个人的公司或机构很少。

当今天保险行业需要处理医疗的数据内容,通过人工来处理报告的数据输入、往往需要花费一天时间,结构化成本非常高;而借助我们的模型和平台、可以实现秒级速度迅速完成资料的结构化,这就是我们的技术实力。

AI 科技评论:数据样本的问题怎么解决?

张朝明:举个简单的例子,医疗行业的体验报告样式各不相同,当使用 AI 模型对体检报告进行结构化处理,几万篇同一模板格式的报告数据、对圆代码的技术研究作用不大。当体检报告样式有十几万种,要将这十几万种报告都找齐、再进行模型识别训练,这件事也并不现实。此外,如保险等此类隐私数据,我们也很难通过网络途径获取,隐私数据禁止买卖,上述均是十分现实的情况,如果问题无法解决,很难进行后面的训练。

对此,圆代码的思路是,在找不到一千份、一万份前提下,我们能否找到二十份小样本数据,基于二十份数据加上我们的技术,将适用于整个行业的模型训练出来,把图文信息转化为结构化数据,走自研底层技术、用更少的数据达到更好效果的模式。

小公司创业能做、但难度很高

AI 科技评论:小公司想做大模型创业,今天还有机会吗?

张朝明:有机会,但也很难,看的就是谁先能跑出来。

今天小公司想做大模型创业,我觉得其创业门槛相比小模型时代已经极大地降低了,但同时我们也要看到它最终能做成功的难度非常高。非常难的原因在于,首先一定需要有极强的科研能力,这对创业公司来说要在技术和人才上迅速拉平需要非常大的成本,这是第一点。

第二点,在现在这个情况下,不管做大模型也好、做小模型也好,一个公司手里如果没有四五十块显卡,连模型都跑不起来。显卡的投入轻易在几百万、上千万,这也意味着,一笔投资两三百万的种子轮融资,难以支撑一家企业购买硬件设备的钱。

可以说,上述两个问题就已经把绝大部分的创业公司都杀掉了,所以我认为,当前创业公司已经很难能够跑出来,在这个纯技术的赛道上,窗口已经关闭了。

AI 科技评论:AI 公司和 "AI+" 公司的区别在哪里?

张朝明:区别在于 AI 为二者的服务、业务提供了哪些方面的能力。很多 AI 大模型的创业公司会使用开源模型,在开源模型上建模,但我们要看它建的是哪种模。

举个例子,做 AI 的公司把证券公司需要的数据给到证券公司,使用了它在 AI 上的能力来解决证券公司的人的需求,这叫做 AI 公司;而使用 AI 能力解决证券问题,体现的是公司在证券方面的建模和分析能力,这种我们称之为 AI + 证券公司。大多数做 AI 公司会采用开源的解法来解决一个行业的具体问题,但它的核心能力是在金融建模上的能力,而并非 AI 建模上。

AI 科技评论:做什么模型跟细分行业的相关性大么?

张朝明:在大模型之前,我们做的是行业通用小模型,即对任何文本都可以进行非常结构化的处理。比如律师怎么看合同、想从哪些层面来使用数据等等,这些问题都可以完成。再比如医院的体检报告,通过我们的模型,可以把所有的数据都提供给客户去做任意的筛选分析,也可以向企业提供定向化数据。

AI 科技评论:它跟行业垂类大模型的区别在哪里?

张朝明:垂类大模型并不是针对具体某一个细分领域,它解决的也是行业性的问题。以医疗病例和体验报告的结构化问题为例,假设一家做糖尿病垂类大模型的公司,我可以输入糖尿病病人的病情数据、借助糖尿病垂类大模型解决相关的问题,也可以基于通用大模型基础上、就任意一个疾病种类,用同一套技术去解决新的病情。

这是商业模式的设计,而非技术的设计。也就是说,当你解决了数据源的问题,其实并没有解决别的问题。但在我们看来,大模型应该是一种基础技术,并不是说数据加模型的服务,就能够成为一个大模型。圆代码用大模型提供了一种数据处理的方式,最终也并不参与解决具体的行业问题。

正如前面提到的例子,保险行业需要处理好的、结构化的医疗数据,同时他们也拥有大量的优秀的核保人员和理赔人员,这种高级人才在中国并不稀缺,我们做的事情是,把这些结构化数据给到这些专业的人、擅长的人去分析,而不是去做分析的事情。

(雷峰网雷峰网)

关键词:

 

热文推荐

对话圆代码 CEO 张朝明:做不跟 ChatGPT 对抗的企业大模型,用更少的数据达到更好的效果

通过统一的自然语言指令调用大量知识,ChatGPT改变了人与AI交互的方式,并将进一步改变更多软件的交互模式

2023-05-31

每日头条!宁夏—湖南±800千伏特高压直流输电工程获核准

5月30日,从国家发展改革委传来喜讯,宁夏—湖南±800千伏特高压直流输电工程于5月24日获得核准批复,标志

2023-05-31

桐梓:网格包保 及时解决企业诉求

本报讯(记者娄勤丽)近日,桐梓县住房和城乡建设局进驻县政务服务大厅首席代表何守培在走访贵州桐创置业有

2023-05-31

黄海波演的电视剧有什么(这几部你都看过吗)

海波演的电视剧有什么,这几部你都看过吗很多人还不知道,现在让我们一起来看看吧!1、

2023-05-31

特斯拉亚洲最大交付中心落地北京 马斯克首站蟹岛度假区

【ITBEAR科技资讯】5月31日消息,日前特斯拉首席执行官埃隆·马斯克已抵达北京,标志着他时隔三年再次踏足

2023-05-31

环球热推荐:passwords must match

1、你2次输入的密码(密码,和再输入一遍确认密码)不一致吧,注意大小写。2、密码要英文+数字。本文到此分

2023-05-31

世界讯息:多项指标满意度均超八成 外资企业持续看好中国经济发展前景

5月30日中国贸促会新闻发言人王琳洁在月度发布会上介绍首届中国国际供应链促进博览会链博会将于11月28日至1

2023-05-31

临夏州禁毒工作取得显著成效

临夏州禁毒工作取得显著成效  每日甘肃网临夏讯(新甘肃甘肃日报记者王虎)记者近日从临夏州禁毒办获悉,

2023-05-31

红米Note 12T Pro发布:1999元512G 送一年碎屏险 世界今头条

小米旗下RedmiNote12TPro正式发布,配备天玑8200-Ultra处理器、6 6英寸顶级LCD屏幕、144Hz的7档变速高刷等

2023-05-31

信用卡逾期还款该怎么办?信用卡欠款20万还不起了怎么办?

一、信用卡逾期还款该怎么办?1、表现积极还款的态度要想跟银行进行协商,申请延长还款期限、分期偿还或

2023-05-31

央行适度加大逆回购操作规模 资金面平稳跨月无虞|环球今日报

5月30日,中国人民银行(下称“央行”)以利率招标方式开展了370亿元7天期逆回购操作,以维护月末流动性平稳

2023-05-31

焦点观察:初三300多分高中可以赶上来吗(初三考300到400能上高中吗)

每日小编都会为大家带来一些知识类的文章,那么今天小编为大家带来的是初三考300到400能上高中吗方面的消息

2023-05-31

乌克兰危机爆发后俄首都居民区首次遭袭,普京发声!

乌克兰危机爆发以来俄首都居民区首次遭袭俄罗斯莫斯科市市长索比亚宁发布消息称,该市当日早晨遭到无人机袭

2023-05-31

全球微动态丨双良节能05月30日获沪股通增持39.22万股

05月30日,双良节能获沪股通增持39 22万股,最新持股量为1814 82万股,占公司A股总股本的0 97%。

2023-05-31

看:井陉这位环卫工人经历了什么?

环卫工人是城市的美容师,每日用辛勤和汗水,在晨曦中扮靓城市,在晚霞下为城市梳妆。▲图片来源于网络5月3

2023-05-31

如何办理港澳通行证(如何办理港澳通行证,需要些什么材料?)|每日热讯

1、身份证、户口本、医疗保险证原件及复印件(若非本地户口,则需于出入境处填写外调函表格,回函后可办理签

2023-05-31

焦点消息!格力空调怎么调制冷模式不出水_格力空调怎么调制冷

1、按遥控器上的on键打开空调。2、按几次mode键,直到屏幕显示“制冷”,这就是制冷模式。3、上下点击“三

2023-05-31

江化微:股东拟减持不超过0.02%的股份

5月31日,江化微发布股份减持公告,股东姚玮拟减持公司股份不超过6 31万股,减持比例不超过公司总股本的0 0

2023-05-31

yy女主播是谁_yy女主播视频下载|环球快看点

1、文儿2、屌丝们的最爱,身为娱家一姐的她,有着很高的人气,甜甜的小酒窝,她自13年年度以来,绯闻不断,

2023-05-31

【全球报资讯】美元指数30日下跌

美元指数30日下跌---  衡量美元对六种主要货币的美元指数当天下跌0 10%,在汇市尾市收于104 1665。

2023-05-31