不要慌，ChatGPT这波中国科技界认输还早

2023年2月9日 1,397

博客

这两天关于ChatGpt的讨论比较多，

一方面有些过热，一方面有些离谱，

有的人直接就又跪了，谈一下我对这个东西的看法。

首先这个东西是什么？很多人已经做了解释，我也不多说了，

我简单的比喻就是类似钢铁侠的贾维斯，你有一个问题，他会给你一个相对靠谱并且人性化的建议，当然，建议完了事情还是要你继续自己去做的。然后就是关于这个东西大概能带来一个什么样的未来，这个讨论还是比较发散的，有人会发散到职业替代，有人会发散到社会进化，有人会发散到人性变革。想的有点早，本质上看还是一个AI发展的问题。

先简单介绍一下AI的基础问题。

AI三要素是指算法、算力和数据，用简单的话讲，算法可以说是计算的方法，好的算法效率高，准确率高，而算力则是硬件能力，在量子计算机诞生之前，在算力方面，不会产生什么跨时代的差距，只不过美国现在想限制我们的算力发展。行业之前努力的方向也是芯片产品的小微化，能够让更多的智能设备具有运算能力。而数据这个层面，那就非常简单了，是AI学习的基础，就好像是你读的书，简单的可以说，你读的书越多，你也就越聪明越有智慧。题外说一句，5G的一个核心价值就是设备可以共享云端算力和边缘算力，这会大大增强小型智能设备的算力，这也是为什么我们会说5G时代才是真正的万物互联的原因。

中国在AI数据方面还是具有显著优势的，硅谷的人工智能公司大部分都只能在算法上想办法。ChatGPT这波说明在算法上，美方已经拉开了代际的差距，也就是领先了一代。为什么是一代，因为上一代人家开源了。不过ChatGPT现在还很贵，360在电话会上介绍，ChatGPT反馈1000个字的成本是0.7美分，我们成本就更高，基本就是白烧钱。但随着算力的增长会逐渐降下来，那时候才有商业化可能。我们虽然代际有差距，但只要算法逐渐跟上了，利用人工成本优势可以降低清洗数据的成本，会实现加速追赶。目前ChatGPT的最大问题就是影响知识准确性，之所以被高校禁用主要是因为提供的知识不准确。这个就是学习的数据还不够干净的问题，需要通过数据标注来逐渐清洗解决。

国内讯飞在专用AI数据模型训练是很专业的，比如教育医疗领域的AI训练。讯飞的智医助理产品，也是唯一通过了国家职业医师资格考试的AI，不过没怎么宣传，大家也不知道。在去年一年的辅助诊断中，已经修正了六十万次错误诊断，包括心力衰竭被判断为水肿，先兆流产被认为是普通的早期妊娠反应这样的关键误诊。药方提示则达到3800万次，其中有52%是无适应症用药，就是头疼开了治脚的药，对病没有帮助，还会带来损伤，还花了医保费。我相信这个模型我们肯定是领先ChatGPT的。

那么数据清洗是啥呢？就是人工标注有效信息。比如说，在医疗领域做X光片病理诊断中，标注人员需要非常专业，甚至是副主任医师专业以上的级别，才能对病理的片子进行正确的数据标注与解读。类似的情况也出现在教育、法律、智能驾驶等多个领域。因为我们人工便宜，所以标注成本就低，只有清洗过的数据有学习的价值。比如人工智能领域有一个有趣的话题，人脸识别的准确率对于有色人种随着肤色的加深会大大下降，这里有一个很重要的原因就是训练数据的不足。如果想要训练一个低精度的人脸识别比如性别识别，那么随便标注性别人像的数据就可以了，但如果要精准识别一个人，就要有不同维度的被标注好的数据。由此也就诞生了定制化的AI数据服务，还原或搭建真实使用场景中所需要的环境，采集好定制化的场景数据并经过精准标注后，用这些高质量数据去训练算法模型，才能使其具有越来越智能。

搜索引擎则具有通用数据优势，这也是为什么360股价大涨的原因。因为360是唯一A股上市的搜索引擎。同时，百度作为搜索引擎，阿里作为购物搜索引擎，微信的搜一搜包括抖音都是有足够的数据可以训练的，只不过抖音要颠覆自己的信息流模式，可能会比较纠结。但最终的入口是什么？是用微信说话的方式，还是直接被手机厂商整合为统一语音助手，就不好说了。

这里可以跟大家简单的说一下一些根本的东西，所有网络信息科技发展的核心结果都是平权。换句话说，就是所有人都能享受基本一致的信息服务，解决信息不平等问题。什么叫信息不平等？比如所谓的医疗资源不平等，教育资源不平等都是类似的不平等。大城市的医疗教育就是比小城市要好，因为医生医院水平更高。但网络一直在改变这些问题，比如远程问诊，比如讯飞的AI医疗助手,就在解决辅助问诊的问题。一些线上的课程则在解决教育不平等的问题。ChatGpt不是颠覆性平台，是一个进化型平台，他未来能做的事情就是把这些不同领域的垂直产品整合到了一个入口，并且以一个人性化的互动方式呈现出来。就是一个万能的贾维斯。如果从平权的角度考虑，大家就不用太担心工作替代的问题，如果你的工作不是利用信息差的工作，那么可能还是不会被替代的，不过因为效率的提升，可能会带来岗位的减少。这有点类似之前的打字员这种岗位，就会因为电脑普及被替代的。但事实上大部分这种信息类的工作核心还是要跟人沟通和执行，方案并不重要。而一些类似法院之类的单位能够用这个东西判案，交警用这个判定责任，保险公司用这个核定赔偿，倒是提高社会治理效率和处理纠纷的好方法。如果说意义，我觉得最大的意义可能会改变目前信息流茧房问题，人们开始重新回到通过互动来获取信息，而且搜索开始从关键词开始变成问题导向。所以类似知乎，知道这种内容会被大幅抓取和学习，这也更接近用户的习惯。这也就意味着搜索广告排位的模式或者说信息流推荐插广告的商业模式可能会被颠覆。更可能会变成你跟你的语音助手说，我饿了，它会自动根据你之前的消费习惯来推荐商户，包括电商购物也一样，你有什么问题他会推荐合适的文字内容或者短视频教程，你直接说我想看搞笑的，他就会给你选择，会比信息流模式更精准。

所以大家现在不要慌，在摸着屁股过河这方面，我们还没输过。

Comments | NOTHING

空空如也！

不要慌，ChatGPT这波中国科技界认输还早

你知道疫情这三年我是怎么过来的吗？

这狗操的生活。

兴趣爱好促使本站建立了

WordPress 提示缺少一个或多个推荐的模组

疫情让你恐惧了吗？

国别域名注册查询工具

我的朋友

我的网站