当前位置: 首页 > news >正文

2-1、初识nlp

前言

本文是我学习大模型之后梳理的一点感悟,从毫无概念到触摸到一点门槛,在此记录分享出来。

这部分围绕的是nlp基础部分梳理。我将以我的理解从流程,原理,实践去整理,如果有错误欢迎探讨。

背景

NLP 的全称是Natural Language Processing,即自然语言处理。NLP 解决的核心问题是让计算机能够更好的理解人类的自然语言。总所周知我们平常编写程序,需求转换到业务模块的第一步就是结构化业务场景,将需求中出现的数据、状态、结构化设计转换成数据库的表。仍然记得最早学习开发时候,老师说的一句话就是世界上的应用程序都是运行在oracle之上的。随着业务的发展场景的多样化,数据库又从关系型数据库分化出了非关系型数据库。即一些场景通过结构化描述并无法完全满足需求,用更模糊的数据类型去存储更可以满足现实场景。当然这只是个题外话。

nlp发展则是在计算机结构化之上能够满足更模糊的需求,即我们自然语言中表达的情感,意识。并能够提取映射到真正的逻辑上。

如何理解

从一开始,我就不断想理解nlp到底是个什么东西,但是作为没有经验的程序员来说只能以自身接触的东西作为参考。从java开发的角度,我的理解是NLP 就像 “Java Web 开发” 这个领域,NLP 的通用流程(数据准备→预处理等)就像 MVC 架构,TF-IDF/W2V 等算法就像 MVC 里的 Controller/Service(各环节的具体组件),RNN/CNN 就像 Struts / 传统 Spring(早期主流框架),Transformer 就像 SpringBoot(现代主流、轻量化升级的框架)

nlp从早期发展到如今热门的gpt等大模型功能,其实可以按照上面的描述去理解。而学习的过程就是需要先理解“mvc”是个什么概念,也就是nlp的训练流程,然后再按照这个骨架填充框架学习各种“java框架”,最后再以一个实践项目落地检验自己的学习成功。这边补充下,可能java那些框架,就像算法和模型结构对于nlp一样,前辈造了轮子,我们以此去使用。这也是我目前另外在学习的部分,说实话。对于一个原来只会for,ifelse来说的我有种打开了新世界大门的感觉。

结语

本文以java视角总结了一下nlp大概是个什么东西,后续会再从流程和原理去扩展这部分内容。

http://www.cnnetsun.cn/news/94233.html

相关文章:

  • OpenCore Legacy Patcher终极教程:让老旧Mac完美运行最新macOS
  • 1、开启GIMP图像编辑之旅:从安装到精通
  • 2、开启 GIMP 图形编辑之旅
  • 怎么建立一套高效的设备运维管理体系?
  • 小爱音箱AI升级:让你的智能音箱秒变高智商语音助手
  • UnrealPakViewer终极指南:从入门到精通的Pak文件分析完整教程
  • 俄罗斯T-Tech公司推出T-pro 2.0:让AI说俄语更流利混合智能模型
  • MCP智能体连接协议面临企业级挑战
  • 联想发布数据存储新品助力企业AI发展
  • 人工智能使用大揭秘:OpenRouter公司百万亿规模数据分析报告
  • 微信DAT文件转换神器,牛批了
  • OBS音频插件实用技巧:专业级直播音效快速配置指南
  • BetterNCM插件配置全攻略:5步打造你的专属音乐工作站
  • 如何5分钟掌握网盘下载加速:告别限速的终极方案
  • 26年找实习的前端,建议跟着飞书准备面试...
  • 毕业论文知网AIGC怎么降?推荐10款免费降AI工具,完美保留原格式且无AI味!
  • “草台班子”的真相:为什么说未来十年,普通人逆袭的机会在这里?
  • 知网/维普AIGC怎么降?2025年降AI率工具大盘点,AI率低于10%且完美保留原格式!
  • 2025年降AI率哪个工具靠谱?5个工具核心优势解析,笔灵降AI性价比领先!
  • 年终总结,爆梗朋友圈
  • springboot健康管理小程序
  • PDF对比终极方案:如何用diff-pdf快速找出文档差异
  • Burp Suite抓包失败的5个常见原因及解决方法,第3个最容易被忽略!
  • 显卡驱动彻底清理指南:3步用DDU解决残留问题
  • Java毕设项目推荐-基于JavaWeb的心聘求职平台的设计与实现求职就业平台设计与实现【附源码+文档,调试定制服务】
  • XUnity自动翻译插件:零基础入门到实战精通指南
  • OBS直播优化全攻略:从新手到专家的配置进阶之路
  • 面试问题预测:LobeChat模拟真实考场
  • LobeChat能否对接冥王星地形图?柯伊伯带天体特征科普
  • TegraRcmGUI:Nintendo Switch自定义payload注入的图形化解决方案