当前位置: 首页 > news >正文

告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词

正如奥特曼执意打造硬件,试图打破手机屏束缚,要让 AI 感受物理世界;Looki 的诞生也源于同样的渴望:补齐大模型「感官智能」的最后拼图,将现实场景实时转化为上下文,驱动人机交互从「被动问答」进化为「主动共鸣」。

2025 年,AI 硬件赛道喧嚣一片。从形态各异的 AI 眼镜,到 OpenAI 传闻中的无屏设备,无数玩家正试图摆脱智能手机的束缚。其底层逻辑清晰可见,今天的 AI 不缺智商,缺乏的是「在场感」。

被困在对话框里的大模型如同「缸中之脑」。当你需要复盘会议或分析孩子情绪时,却不得不将鲜活场景压缩成干巴巴的文字描述,这种依赖「手动 Prompt」的交互不仅低效,更是反人性的。我们被迫充当了 AI 的「人肉传感器」,而大模型因缺乏 Context(上下文语境),始终处于对物理数据的极度饥渴中。

「在物理世界中,人类本质上是被动的生物。我们期望让 AI 变得主动。」Looki 创始人兼 CEO 孙洋一语道破。

正是带着这样的思考,一支自带自动驾驶基因的团队,试图将那套解析道路环境的「从感知到决策」逻辑复用到日常生活中,填补大模型对于物理世界的认知「盲区」。他们打造的 Looki L1,在北美市场积累首批口碑后,于今天正式面向国内发布。

这款 AI 原生多模态可穿戴设备,旨在将实时视听信号转化为模型上下文,让物理世界本身,成为驱动 AI 思考与服务你的最高效 Prompt。

一、藏在 30g 机身里的「智能感知」系统

从「车看路」到「AI 看世界」,这是自动驾驶感知算法的一次微缩实战。

如果说云端大模型是「大脑」,那么 Looki L1 就是由于算力限制而不得不外挂的「视神经」。第一眼看到 Looki L1 的人,很难不将它误解为一款挂坠形态的相机。它形态十分迷你,仅重 30g,支持磁吸或直接佩戴。

这种误解源于我们对「镜头」的固有认知,镜头生来是为了审美服务的。但对于 Looki 来说,镜头是服务于机器认知的,它本质上是一个庞大的、始终在线的多模态感知器。它不需要拍得「美」,但必须拍得「懂」。它支持 1080P/30 帧画面,待机 12 小时拍摄,就像一块海绵,全天候吸收你的光影世界。

孙洋认为,任何硬件形态都有其优劣势,AI 眼镜当下在续航、重量和功能上存在「不可能三角」。而 Looki 选择挂坠形态,则是在当前供应链能力下,为了实现「全天候静默采集」这一核心需求的最佳妥协方案。

这种妥协背后,是团队技术基因的「降维打击」。

「以前是教车怎么看路,现在是教 AI 怎么看懂你的生活」,孙洋谈道。这种跨界视野,源于两位创始人独特的履历拼图。孙洋和刘博聪均毕业于卡内基梅隆大学,而在分别执掌美团智能硬件与自动驾驶算法业务之前,他们还曾在 Momenta 与 Pony.ai 两家自动驾驶企业深耕一线。

他们将自动驾驶「从环境感知到自主决策」的闭环逻辑,从道路平移到了生活场景,其感知机制体现在两个层面:

  • 首先是多维感知。它使用了多模态大模型,视觉识别场景物体,听觉捕捉环境情绪,构建起对物理世界的初步认知。
  • 其次是高效吞吐。 通过「智能间隔拍摄」技术,确保在极低功耗下实现海量视听数据的实时采集。

这套机制构成了团队从「车」迁移到「人」的底层基座,更为接下来的云端处理提供了丰富的原始数据。

二、超越 RAG,搭建一套专属用户的「数据飞轮」

从「多维数据」到「结构化记忆」,真正的壁垒在于构建一套用户专属的 Context Engineering(上下文工程)。

Looki 团队沿用自动驾驶的「数据飞轮」逻辑,来重塑用户的个人记忆:从硬件端收集数据,到建立多层级数据索引和多任务拆解,最终打造一套高效工作的 Agentic System(代理系统),让 AI 能像人脑一样,有索引、有重点地调用你的生活数据。

据 CTO 刘博聪介绍,这套系统的独创性,在于挑战了当前多模态模型的两大痛点:

首先是「长时序数据理解」。针对大模型处理大量多模态数据流(如数十万级别)容易产生「幻觉」的通病,团队通过工程优化,让 AI 能准确理解,并串联起跨度极长的时间切片。

其次是应对「多模态数据的 Context 爆炸」。视频与图像的查询会消耗巨大的上下文窗口。Looki 在云端构建了一套高效的上下文管理机制,能够根据查询需求,在海量数据中精准提取关键特征,而非粗暴地将所有素材灌入模型。

当然,这一切的基石是数据的隐私安全。Looki 通过端侧隐私过滤与 App 手动上传机制,确保数据流转的安全性。最终,物理世界的切片,被转化为结构化的「云端记忆库」。

如果说 GPT 是你工作的上下文,装载了人类的通用知识;那么 Looki 正在构建的,就是你生活的私有上下文,装载了你独一无二的经历与轨迹。

三、从「手动 Prompt」到「主动式 AI」

当语境足够丰富,交互终将进化为主动式「预判」。

目前硅谷普遍认为,我们终将迎来从 Chatbot 走向 Agentic AI(代理式 AI) 的范式转移。行业预测显示,自主 AI 代理市场将在未来三年迎来爆发性增长,而 Memory(记忆)与 Context(上下文) 正是这场进化的核心护城河。

Looki 的野心,正是基于这两者,通过可穿戴硬件构建通往「主动智能」的入口。

目前,Looki 交付给用户最显性的功能是「AI 自动剪辑」。它精准切中了那些热爱记录、却被后期剪辑劝退的用户痛点。用户在佩戴拍摄的同时,Looki 的算法自动识别一天中的高光时刻,自动生成有叙事逻辑的 Vlog。

基于这层理解,真正的质变在于「隐性洞察」。

随着记忆库的沉淀,Looki 将不再是被动等待指令的记录仪,而是能够进行推理的 Agent。它不仅记录你的饮食,更能在你点夜宵前,基于全天摄入主动发出「热量预警」;或在你情绪激动时,基于对话语境提供理性的沟通建议。

这种基于实时物理反馈的交互,让 AI 从「被动问答」进化为「主动共鸣」,这才是 AI 硬件区别于手机 App,能够真正接管用户生活的核心价值。

四、结语:当物理世界成为提示词

在 Looki 团队的构想中,硬件形态从来不是终点,而是一个「长在物理世界里的数据接口」。这也道出了 Looki 的实质:无论它今天是挂坠,还是未来演化为眼镜或耳机,其核心使命从未改变,那就是解决物理世界的数据饥渴,帮用户积累最宝贵的私有数据资产。

在 AI 时代,算力会被摩尔定律稀释,模型会被更强的版本迭代,但你在这个世界上生活过的痕迹、你眼中的风景、你与家人的对话,这些 Personal Context 构成了独一无二的你。而 Looki,就是帮你将这份资产,转化为 AI 能够理解共情的「数字直觉」。

当 AI 拥有了「在场感」,它就不再是云端那个冰冷的工具,而是你生活中的「第二大脑」。

最强大的 Prompt,其实是你未曾说出口的生活本身。

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量

http://www.cnnetsun.cn/news/92968.html

相关文章:

  • Molecular Operating Environment (MOE) 完整安装与配置指南
  • LobeChat能否用于生成直播话术?电商主播提词器
  • 终极C++网络编程:构建高性能HTTP服务的完整指南
  • 显卡驱动终极清理指南:一键彻底解决兼容性问题
  • Zotero GPT:用AI重新定义文献管理效率
  • LobeChat与LangChain结合应用:打造复杂AI工作流
  • 突破60帧束缚:原神性能优化工具深度解析
  • 云计算作业—-V L AN实验
  • 当连锁巡检“听懂人话”:VLM技术下的智能运营新场景
  • 责任链模式(Chain of Responsibility):实现事件或请求的逐级处理与传递
  • SMUDebugTool深度探索:解锁AMD Ryzen系统的隐藏性能
  • JavaScript 中的单例模式:利用闭包、IIFE 或 ES Modules 实现线程安全的单例
  • CORS 机制中的预检请求(Preflight Request):为什么 OPTIONS 请求总是先于复杂请求发送?
  • Google Drive文件下载终极指南:简单快速解决下载难题
  • 面对一个新领域,如何快速摸清门道?试试“一键生成”研究地图
  • 终极指南:5步实现全球付费内容免费阅读
  • GBase 8s数据库SYSTIMESTAMP表达式介绍(上)
  • 从“秒级”到“毫秒级”:金仓如何让InfluxDB的“时序神话”黯然失色?
  • zotero-style插件深度解析:从零打造高效文献管理生态
  • 5倍推理加速:Axolotl缓存策略如何终结重复计算瓶颈
  • LobeChat能否部署在华为云弹性云服务器?国产化替代实践
  • LobeChat备份与恢复策略:防止重要对话丢失
  • Access Token 生命周期管理:详细设计 Token 的获取、缓存、续期和过期处理机制
  • 客户群 ID 与业务 ID 映射:设计高性能数据库表结构,实现 ChatID 与内部业务标签的快速关联
  • 代码随想录算法训练营Day48 | 108.冗余连接、109.冗余连接II
  • 微信网页版访问困境突破:3步安装wechat-need-web插件实战指南
  • MFC扩展库BCGControlBar Pro v37.1——支持Visual Studio 2026
  • 知乎专题策划:LobeChat是否真的值得入手?
  • 毕业论文AIGC全线飘红?揭秘5个“去AI化”核心手段,附保姆级工具清单
  • MTKClient:如何快速掌握联发科设备调试的核心技巧?