ag百家乐可以安全出款的网站 麻省理工商榷东谈主员进步机器学习模子准确性

机器学习(ML)有可能通过行使深广数据进行展望瞻念察来改造医疗决策。然则ag百家乐可以安全出款的网站,当这些模子在不成充分代表统共东谈主口群体的数据集上进行历练时,就会出现一个严重挑战。展望疾病患者调停计算的模子不错在主要包含男性患者的数据集上进行历练。这可能会导致对女性患者的展望不准确。这种偏见可能会导致无益的冷漠,异常是对代表性不及的群体。

一种处分决策是退换或均衡历练数据集,以确保统共子组齐得到对等暗示。然则,这种数据均衡模范加多了复杂性,也可能缩小模子的合座性能。此外,这种模范可能需要走访历练组贵重,最终可能会删除数据集的大部分。

麻省理工学院的商榷东谈主员遴荐了不同的模范。他们开拓了一种新工夫,不错识别和删除历练数据齐集对模子在代表性不及的群体中推崇欠安影响最大的特定点。

这种工夫莫得假定每个数据点对模子的性能齐有同等的孝顺,而是意志到某些点对模子有偏见的展望产生了不成比例的影响。

商榷东谈主员的数据模子去偏(D3M)最初使用了一种称为最差组裂缝的有缠绵,该有缠绵猜度模子在某些亚群上的推崇存多差。然后,该模子通过使用他们称之为数据建模的框架来进步性能,该框架将展望雷同为列车数据的浅近函数。这使他们或者量化单个数据点何如影响最差的团队绩效。

使用这种模范,商榷东谈主员不错识别出最有问题的数据点。然则,这种模子并莫得删除大部分数据,而是弃取性地只删除最无益的数据。

在代表性不及的数据缺失或未标志的情况下,D3M的模范仍然不错通过分析数据本人来发现荫藏的偏见,使其成为进步平允性的有劲用具,ag百家乐大平台即使数据有限或未标志。

麻省理工学院电气工程与诡计机科学(EECS)商榷生、在arXiv上发表的一篇论文的共同主要作家Kimia Hamidieh说:“好多其他试图处分这个问题的算法齐假定每个数据点齐和其他数据点雷同谬误。在这篇论文中,咱们讲解了这一假定是不正确的。咱们的数据齐集有一些特定的点导致了这种偏见,咱们不错找到这些数据点,删除它们,并得到更好的性能。”

Hamidieh与来自麻省理工学院的Saachi Jain、Kristian Georgiev、Andrew Ilyas以及资深作家Marzyeh Ghassemi和Aleksander Madrt共同撰写了这篇论文。这项商榷将在神经信息处理系统会议上发表。

商榷东谈主员的新工夫配置在他们之前的责任基础上,他们开拓了一种名为TRAK的模范,该模范不错为特定的模子输出细则最有影响力的历练示例。

麻省理工学院的团队宣称,D3M模范进步了最差的组准确率,同期比传统的数据均衡模范减少了约20000个历练样本。

Hamidieh说:“这是任何东谈主在历练机器学习模子时齐不错使用的用具。他们不错寻查这些数据点,望望它们是否与他们试图讲解模子的智力相一致。”

商榷东谈主员计算考证这种模范,并通过未来的东谈主体商榷进一步发展它。他们的标的之一是使该模范易于使用,便于医疗保健专科东谈主员使用,从而不错在试验环境中部署。

字据该论文的合著者Ilyas的说法,“当你有用具不错批判性地寻查数据并找出哪些数据点会导致偏见或其他不良活动时,它就为你构建更平允、更可靠的模子迈出了第一步。”

这项商榷的服从可能有助于处分东谈主工智能和机器学习模子的一个恒久问题:它们的有用性取决于它们所历练的数据。若是不错通过可推广的算法识别和删除缩小东谈主工智能模子合座性能的数据点ag百家乐可以安全出款的网站,异常是关于大型数据集,这可能会改造游戏端正,进步多样应用门径的模子准确性和可靠性。