研究人员开发了一种方法,可以在直播平台上提高审核模型的性能

放大字体  缩小字体 2023-12-08 13:49  浏览次数:

Twitch

抽搐。有些人认为它是一个有趣的游戏玩家和善意的电子竞技爱好者的在线社区。对其他人来说,这是一股充满潜在有毒内容和仇恨言论的危险流。

在不断发展的数字通信环境中,Twitch和YouTube Live等直播平台上信息的实时性给内容审核带来了独特的挑战。目前,由于现有模型是在Facebook或Twitter等非实时社交媒体平台上训练的,因此缺乏有效的直播内容审核工具。

南加州大学维特比信息科学研究所(ISI)的研究助理Dong-Ho Lee和首席科学家Jay Pujara开始改变这种状况。他们开发了一种创新的方法,可以将直播平台上的审核模型的性能提高35%。

保持同步

普哈拉说:“如果我在Twitter或Reddit上发布了一些东西,可能会有人在几小时或几天后回复。但如果我们看看Twitch,这是一个非常不同的环境。人们每秒钟都在发送信息。”

这一切都归结于时机。Twitter、Facebook和Reddit都是异步的——用户在上面发表他们的想法,但是回复不是即时的。另一方面,Twitch、YouTube Live和其他直播流媒体平台是同步的——这相当于在现场对话。

在异步平台上的会话中,思想通常被分组到允许会话上下文的线程结构中。而且用户没有时间限制,所以他们可以发表更深思熟虑的评论。而在同步平台上,思想是实时、连续地呈现的,没有结构来指示上下文。快节奏的本质鼓励快速反应和多个简短的评论。

这是一种史无前例的方法

看到研究中的这一差距,Lee和Pujara进行了第一个检测直播聊天中违反规范的NLP研究。

“违反规范”是指用户在网络平台上违反既定规则或可接受行为准则的情况。普哈拉解释说:“通常情况下,当你加入[直播]时,会发布一套规则,并且有版主试图弄清楚人们是否违反了这些规则。你在骚扰别人吗?你是想转移话题吗?你在发送垃圾邮件吗?”

该研究的作者团队包括ISI的博士生Justin Cho和Woojeong Jin,以及南加州大学维特比托马斯勋爵计算机科学系的研究副教授Jonathan May,他们使用了Twitch上4583条违反规范的评论的数据集,这些评论是由人工频道主持人主持的。

“他们收集了每个Twitch主播的聊天规则,召开了反复的会议,对违反规范的类型进行了分类,并管理了标注各种直播会话的注释员,以分析Twitch的违规行为,”李说,“这涉及到各种行业合作伙伴和学术机构的重大共同努力,首次研究了直播聊天中的违规行为。”

把人类带进来,还有细节

普哈拉说:“我们做这件事的方式很有趣,为了给数据贴标签,我们众包。我们让人给它贴上标签,然后这些人基本上会得到三个层次的细节。因此,我们逐渐向他们提供更多信息,以便能够评估正在发生的事情。”

提供了什么样的细节?该团队设计了一个过程,以确定围绕缓和评论的不同级别上下文的影响。例如,聊天历史记录是否有影响——评论者在审核内容之前的最后一条消息,或者在审核评论前后的更广泛的聊天记录?评论发布的时候视频里发生了什么?是否有任何与评论特定内容相关的外部知识(即频道内的特定表情符号或俚语)。

有限公司语境至关重要

事实证明,当涉及到调节直播流时,上下文很重要。

普哈拉解释说:“你可以通过使用不同数量的信息来提高审核的质量。所以,如果你正在为Twitch设计一个自动审核系统,你真的需要考虑什么是正确的背景来解释人们所说的话。”

团队使用这些信息,确定了最能帮助人类版主的信息上下文,并训练模型通过利用这些上下文信息来识别违反规范的行为。他们的研究结果表明,上下文信息可以将模型调节性能提高35%。

Pujara和Lee的论文《分析直播聊天中的规范违反》可在arXiv预印本服务器上获得,并将在2023年12月6日至10日在新加坡举行的2023年自然语言处理经验方法会议(EMNLP 23)上发表。

Lee说:“我很高兴能参加EMNLP并展示我们的研究。此外,我还想发表另外两篇论文——《利用上下文学习进行无知识的时态知识图预测》和《使大型语言模型成为更好的数据创造者》——这是我和Jay共同完成的。

更多信息:Jihyung Moon等,分析直播聊天中的规范违反,arXiv(2023)。DOI: 10.48550/ arXiv .2305.10731

南加州大学提供
引用:研究人员开发了一种方法,可以提高直播平台上审核模型的性能(2023年12月7日 作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。的有限公司 内容仅供参考之用。

热门搜索排行
声明:本站信息均由用户注册后自行发布,本站不承担任何法律责任。如有侵权请告知,立即做删除处理。
违法不良信息举报邮箱
晋ICP备17002844号
中国互联网举报中心