当前位置:首页 > 家装 > 装修设计 > 文章正文

AI(NLP语义倾向)标注对象产品设计的5个锦囊

编辑:[db:作者] 时间:2024-08-25 03:59:50

一、认知根本

个人不雅观点的认知根本如下,如果读者不认同50%以上,那么就没必要摧残浪费蹂躏韶光阅读后续内容了,反之,我希望大家多质疑与互换,通过Q&A来共同进步。

AI(NLP语义倾向)标注对象产品设计的5个锦囊

认知1:人工智能发展粗略可以分3个阶段:符号主义(第1阶段)→ 联结主义(第2阶段)→ 空想AI(第3阶段),我们将长期(>30年)处于第2阶段

符号主义:代表人物纽厄尔和西蒙,认为人类的智能不管多繁芜,归根到底都是由符号打算来实现的。
只要打算机科学家设计了适宜的程序,打算机早晚有一天能凭着符号的打算,也能提出相对论、创造罗纳尔多的射门、而剪纸捏泥人和书法篆刻就更不在话下。

符号主义的毛病:很难在非常繁芜的求解组合中快速找到最优解。

联结主义:代表人物大卫休谟,认为人工智能的紧张任务是建立大脑的模型,不是预先给定办理问题的算法,而是构建一个在打算机上仿照的“神经元网络”,让机器自主地建立不同神经元之间的“联结”,通过终极结果的反馈,不断调度联结的模式,终极逼近最优解。

联结主义的毛病:过于依赖履历数据

空想AI:感知智能+认知智能+情绪的主不雅观感想熏染+自我意识

空想AI的毛病:暂时无实现方案

认知2:AI实行语义理解任务,当前已经到了技能成熟期,后续依赖产品力和数据

粗暴一点说,各家算法基本无差别(<10%)。
以办理实际业务问题、实现业务代价为衡量标准的话,产品的易用性(决定落地门槛/规模/效果)、组件化程度(决定本钱),数据的数量和质量,才是决定代价的砝码。

认知3:中国现阶段(10年内)ToB市场,大B的真需求都在自给自足,第三方做事中小B才是正途

大B只有探索型需求和伪需求(为了系统编制内的升官发财)才会留给第三方,以是一个第三方公司如果敢说只做大B,那么一定是去世路一条或者半去世不活(无法建立壁垒/低利润率)

二、为什么我们须要标注?

认知1中提到“联结主义的毛病在于过度依赖履历数据”,那履历数据是什么?履历数据 = 已标注数据。

未标注数据只能用于无监督机器学习,当前实行99%以上AI任务的都是有监督机器学习模型,估量未来30年以内还会保持现状。
以是数据标注便是绕不开的槛。

三、锦囊

效率高是好的标注工具的唯一标准,以是3条锦囊全部都是环绕语义标注工具效率提升。

效率 = 认知效率 + 操作效率 + 智能化,以下锦囊也都是沿着这3个提升效率的方向进行的产品设计。

锦囊1:互斥性原则

语义模型实质上是一个分类模型,分类最关键的是种别清晰,例如想想折磨我们的垃圾分类。
互斥性值得便是不同类之间要做到不重不漏(漏的部分一定设置专门的“其他分类”来兜住)。

详细到产品设计上,歧义优化(根据向量相似度,自动识别不同类之间存在交叠关系的语料),分类解释(设置为必填项)等都是互斥性事理的详细表示。

锦囊2:聚类冷启动

Bert无监督聚类模型做冷启动,“效果杠杠的,谁用谁知道”。
缺失落此模块,数据标注职员冷启动阶段就全靠想象力“瞎编”。
我见过太多数据职员编写相似句(同一语义不同句式表达办法)写到生无可恋。
上线周期还会由于标注效率低和效果差一拖再拖。

锦囊3:By分类智能推举待标注语料

来,这一条锦囊大家可以在评论区猜一猜是啥意思?

锦囊4:Badcase闭环调优

语义模型调优 = 正向调优(By准确率)+ 反向调优(By Badcase)

Badcase指模型判断结果存在偏差的语料(来自于测试集+业务侧网络反馈),是极其宝贵的复盘资料。
设计事理是从点状问题(Badcase)顺藤摸瓜找到实质问题(如ASR准确率、语义分类体系问题、存在大量歧义等)进行办理。
反向调优可以极大提升模型的准确率、覆盖率等核心指标。

锦囊5:隔离数据管理与标注工具

若不进行隔离,随着产品功能繁芜度的提升,标注工具的认知门槛会陡增。
可以理解为厨房里的原材料和锅碗瓢盆混在一起丢到了一个橱柜中。
这将严重影响产品给用户的确定感,会将标注效率直接打6折。

结语

AI实行语义任务,标注是绕不过的槛。
但只要我们通过“傻瓜式工具”赞助用户轻松迈过去,AI对真实场景的赋能代价将被放大100倍以上。

作者:张佳伟,AI产品经理

本文由 @张佳伟 原创发布于大家都是产品经理,未经作者容许,禁止转载。

题图来自Unsplash,基于CC0协议。

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/lz/zxsj/110538.html

XML地图 | 自定链接

Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码

声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com