当前位置: 首页 > news >正文

[ACL 2022]Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding

论文网址:Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding - ACL Anthology

论文代码:https://github.com/GanjinZero/ICD-MSMN

目录

1. 心得

2. 论文逐段精读

2.1. Abstract

2.2. Introduction

2.3. Approach

2.3.1. Code Synonyms

2.3.2. Encoding

2.3.3. Multi-synonyms Attention

2.3.4. Classification

2.3.5. Training

2.4. Experiments

2.4.1. Dataset

2.4.2. Implementation Details

2.4.3. Baselines

2.4.4. Main Results

2.4.5. Discussion

2.4.6. Memory Complexity

2.5. Related Work

2.6. Conclusions

1. 心得

(1)感觉创新一般般,正文内容偏少

2. 论文逐段精读

2.1. Abstract

①作者认为现在大家都在关注标签相似度,但作者也想关注同义词编码

②作者想把ICD标签和UMLS知识库对齐以收集同义词

2.2. Introduction

①作者觉得需要匹配同义词如“甲状腺功能减退”=“低的t4指标”

②作者提出Multiple Synonyms Matching Network (MSMN)去解决同义词问题

2.3. Approach

①设自由诊断文本为,其中的单词集是

②任务:多标签分类

③MSMN框架图:

2.3.1. Code Synonyms

①先把每个ICD标签对齐UMLS的概念唯一标识符(CUIs)

②将同义词去掉连字符和NOS(Not Otherwise Specified)之后与ICD标签连接

③每个词组都由很多单词组成:

hyphen n.连字符

2.3.2. Encoding

①以前的工作觉得BERT不能帮助ICD分类所以作者选了LSTM作为文本编码器??这,这样写真的好吗

②作者使用一个层的双向LSTM去编码每个单词:

③对同义词也采用同样的编码方式:

2.3.3. Multi-synonyms Attention

①受多头自注意力的启发,将原始标签特征拆分成个(契合多头的不同头)

分别对每个头把同义词标签组和文本特征实行点积计算相似度,然后把每个头算出的相似度分别和文本特征乘起来:

只要至少一个同义词匹配到了相关文本,该特征就会被保留。增强了模型对表达多样性的鲁棒性。

2.3.4. Classification

①使用biaffine transformation计算相似度用于分类:

减少了计算量

2.3.5. Training

①交叉熵损失:

2.4. Experiments

2.4.1. Dataset

①数据集:MIMIC-III full和MIMIC III 50

②数据集统计:

2.4.2. Implementation Details

①同义词数量:在MIMIC III full中,在在MIMIC III 50中

②同义词是随机挑选的同个数,如果数量不够就一直重复

③文本嵌入是用的别的文章的,CBOW什么的

④使用R-Drop且

⑤嵌入后的Dropout rate:

⑥一些超参数:

2.4.3. Baselines

①基线:CAML、MSATT-KG、MultiResCNN、HyperCore、LAAT%JointLAAT

2.4.4. Main Results

①在MIMIC III full上的对比实验:

②在MIMIC III 50上的对比实验:

2.4.5. Discussion

①尝试不同的同义词数量和不同的文本-标签匹配方式:

②同义词表征空间:

2.4.6. Memory Complexity

①使用Einstein 求和优化来少求注意力得分的中间内存

2.5. Related Work

①举例一些机器学习,RNN/CNN,标签注意力,图卷积,知识图谱

2.6. Conclusions

~

http://www.cnnetsun.cn/news/94079.html

相关文章:

  • 微信DAT文件转换神器,牛批了
  • OBS音频插件实用技巧:专业级直播音效快速配置指南
  • BetterNCM插件配置全攻略:5步打造你的专属音乐工作站
  • 如何5分钟掌握网盘下载加速:告别限速的终极方案
  • 26年找实习的前端,建议跟着飞书准备面试...
  • 毕业论文知网AIGC怎么降?推荐10款免费降AI工具,完美保留原格式且无AI味!
  • “草台班子”的真相:为什么说未来十年,普通人逆袭的机会在这里?
  • 知网/维普AIGC怎么降?2025年降AI率工具大盘点,AI率低于10%且完美保留原格式!
  • 2025年降AI率哪个工具靠谱?5个工具核心优势解析,笔灵降AI性价比领先!
  • 年终总结,爆梗朋友圈
  • springboot健康管理小程序
  • PDF对比终极方案:如何用diff-pdf快速找出文档差异
  • Burp Suite抓包失败的5个常见原因及解决方法,第3个最容易被忽略!
  • 显卡驱动彻底清理指南:3步用DDU解决残留问题
  • Java毕设项目推荐-基于JavaWeb的心聘求职平台的设计与实现求职就业平台设计与实现【附源码+文档,调试定制服务】
  • XUnity自动翻译插件:零基础入门到实战精通指南
  • OBS直播优化全攻略:从新手到专家的配置进阶之路
  • 面试问题预测:LobeChat模拟真实考场
  • LobeChat能否对接冥王星地形图?柯伊伯带天体特征科普
  • TegraRcmGUI:Nintendo Switch自定义payload注入的图形化解决方案
  • FlutterOpenHarmony商城App倒计时组件开发
  • Beyond Compare 5终极激活指南:3分钟快速生成永久授权密钥
  • 5分钟搞定Android投屏:QtScrcpy零门槛操作指南
  • Windows 11安装蓝屏终结者:MediaCreationTool.bat实战指南
  • BGE-Large-zh-v1.5终极指南:快速上手文本嵌入模型部署
  • tensorflow 零基础吃透:tf.sparse.SparseTensor 与核心 TensorFlow API 的协同使用
  • tensorflow 零基础吃透:TensorFlow 张量切片与数据插入(附目标检测 / NLP 实战场景)
  • windows用户态到内核态
  • 嵌入式系统(基于FreeRTOS)串口命令行调试工具
  • Qwen3-VL-8B中文多模态实测:懂语境更懂中国用户