圣者
精华
|
战斗力 鹅
|
回帖 0
注册时间 2006-7-3
|
本帖最后由 cys_pitaten 于 2023-1-31 10:22 编辑
这人在回路是个真实存在的AI方向,直接搜就能搜到,随便贴点逼乎的:
人工智能发展有三大动力:数据、算法和算力。信息化的进程帮助我们积累了大量的数据。云计算的规模化促进了算力的快速成长。各种人才计划也保障了算法的不断优化。于是,更多的数据、更优的算法和更强的算力就会叠加为更优秀的人工智能成果。人们对人工智能的预期于是变得十分的乐观。然而,当我们换个角度,审视人工智能在数字化转型中的应用时,赫然发现,针对特定领域的机器学习其实举步维艰。是什么问题让人工智能在这些领域中受挫呢?问题出在了数据上面。
HITL (Human in the loop) 。网络上翻译成:“人在回路”,实在是让人不明所以。我认为应该翻译为:“由人主导的迭代”。更简单点:“言传身教”。在上图的介绍中,原始迭代是:采集数据-数据标记-训练数据-模型-成熟度评估-采集数据... 这样一个过程。在引入HITP后,这个模型具备以下不同点:参考模型度量指标,迭代中通过人工干预的主动学习方式来优化数据集合数据的随机性、多样性和不确定性得到**提升通过人机接口对标记工程进行优化,从而更容易、更高效地得到训练数据引入领域专家知识,使数据的含义更清晰、更明确。也就是说,我们从机器学习的填鸭式教学升级到答疑式教学。我们给机器这个学生配备优秀的老师,来迅速提升他的学习成绩。下面看看这个老师怎么帮助机器来提升学习成绩的。
美剧《绝命毒师》中高中化学老师沃尔特·H·怀特即使生活所迫去制作毒品,合成出来的也是蓝色的高纯度结晶,瘾君子们趋之若鹜。而近期网上流传的4年网课医学院学生则可能导致红色液体流淌事件的发生(这是笑话,大家别当真)。数据科学呢?文字识别或者图像识别的数据标记一般受过基本教育的人就够了,但是医疗影像、工业制成品等专业领域的数据标记则是要依赖多年的技术实践积累为前提。更何况,考虑到数据的不确定性和多样性,专业领域的专家知识就自然格外珍贵了。了解了HITP,如何发展我们的机器学习产业,如何让人工智能在特定领域中被有效使用呢?其实,HITP的发展过程可以理解为"毒师培养计划“,就是培养一批具备专业领域知识而且具备数据科学文化素质的“毒师”,并且发展相关配套的过程。落到实处,胡二先生认为有几下几点:重点培养领域专家的数据文化(data literacy)培养一批数据工程师,加快数据的价值化提供更加自动化的数据科学平台大力发展开放数据库,促进数据的共享与交易。(我们的开放数据库项目还远远不够)平衡好安全与开放的关系,没有开放就没有发展,安全就失去了意义。
作者:胡二先生
链接:https://www.zhihu.com/question/39457337/answer/2791089984
来源:知乎
着作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
========================================================
简单来说图丫丫和现实中的人在回路还是有些不一样(一萝莉能提供什么专家型学习反馈),算是借用这么个概念吧
|
|