当前位置：首页 > news >正文

告别「手搓Prompt」，前美团高管创业，要让物理世界直接成为AI提示词

news 2026/7/1 17:58:33

正如奥特曼执意打造硬件，试图打破手机屏束缚，要让 AI 感受物理世界；Looki 的诞生也源于同样的渴望：补齐大模型「感官智能」的最后拼图，将现实场景实时转化为上下文，驱动人机交互从「被动问答」进化为「主动共鸣」。

2025 年，AI 硬件赛道喧嚣一片。从形态各异的 AI 眼镜，到 OpenAI 传闻中的无屏设备，无数玩家正试图摆脱智能手机的束缚。其底层逻辑清晰可见，今天的 AI 不缺智商，缺乏的是「在场感」。

被困在对话框里的大模型如同「缸中之脑」。当你需要复盘会议或分析孩子情绪时，却不得不将鲜活场景压缩成干巴巴的文字描述，这种依赖「手动 Prompt」的交互不仅低效，更是反人性的。我们被迫充当了 AI 的「人肉传感器」，而大模型因缺乏 Context（上下文语境），始终处于对物理数据的极度饥渴中。

「在物理世界中，人类本质上是被动的生物。我们期望让 AI 变得主动。」Looki 创始人兼 CEO 孙洋一语道破。

正是带着这样的思考，一支自带自动驾驶基因的团队，试图将那套解析道路环境的「从感知到决策」逻辑复用到日常生活中，填补大模型对于物理世界的认知「盲区」。他们打造的 Looki L1，在北美市场积累首批口碑后，于今天正式面向国内发布。

这款 AI 原生多模态可穿戴设备，旨在将实时视听信号转化为模型上下文，让物理世界本身，成为驱动 AI 思考与服务你的最高效 Prompt。

一、藏在 30g 机身里的「智能感知」系统

从「车看路」到「AI 看世界」，这是自动驾驶感知算法的一次微缩实战。

如果说云端大模型是「大脑」，那么 Looki L1 就是由于算力限制而不得不外挂的「视神经」。第一眼看到 Looki L1 的人，很难不将它误解为一款挂坠形态的相机。它形态十分迷你，仅重 30g，支持磁吸或直接佩戴。

这种误解源于我们对「镜头」的固有认知，镜头生来是为了审美服务的。但对于 Looki 来说，镜头是服务于机器认知的，它本质上是一个庞大的、始终在线的多模态感知器。它不需要拍得「美」，但必须拍得「懂」。它支持 1080P/30 帧画面，待机 12 小时拍摄，就像一块海绵，全天候吸收你的光影世界。

孙洋认为，任何硬件形态都有其优劣势，AI 眼镜当下在续航、重量和功能上存在「不可能三角」。而 Looki 选择挂坠形态，则是在当前供应链能力下，为了实现「全天候静默采集」这一核心需求的最佳妥协方案。

这种妥协背后，是团队技术基因的「降维打击」。

「以前是教车怎么看路，现在是教 AI 怎么看懂你的生活」，孙洋谈道。这种跨界视野，源于两位创始人独特的履历拼图。孙洋和刘博聪均毕业于卡内基梅隆大学，而在分别执掌美团智能硬件与自动驾驶算法业务之前，他们还曾在 Momenta 与 Pony.ai 两家自动驾驶企业深耕一线。

他们将自动驾驶「从环境感知到自主决策」的闭环逻辑，从道路平移到了生活场景，其感知机制体现在两个层面：

首先是多维感知。它使用了多模态大模型，视觉识别场景物体，听觉捕捉环境情绪，构建起对物理世界的初步认知。
其次是高效吞吐。通过「智能间隔拍摄」技术，确保在极低功耗下实现海量视听数据的实时采集。

这套机制构成了团队从「车」迁移到「人」的底层基座，更为接下来的云端处理提供了丰富的原始数据。

二、超越 RAG，搭建一套专属用户的「数据飞轮」

从「多维数据」到「结构化记忆」，真正的壁垒在于构建一套用户专属的 Context Engineering（上下文工程）。

Looki 团队沿用自动驾驶的「数据飞轮」逻辑，来重塑用户的个人记忆：从硬件端收集数据，到建立多层级数据索引和多任务拆解，最终打造一套高效工作的 Agentic System（代理系统），让 AI 能像人脑一样，有索引、有重点地调用你的生活数据。

据 CTO 刘博聪介绍，这套系统的独创性，在于挑战了当前多模态模型的两大痛点：

首先是「长时序数据理解」。针对大模型处理大量多模态数据流（如数十万级别）容易产生「幻觉」的通病，团队通过工程优化，让 AI 能准确理解，并串联起跨度极长的时间切片。

其次是应对「多模态数据的 Context 爆炸」。视频与图像的查询会消耗巨大的上下文窗口。Looki 在云端构建了一套高效的上下文管理机制，能够根据查询需求，在海量数据中精准提取关键特征，而非粗暴地将所有素材灌入模型。

当然，这一切的基石是数据的隐私安全。Looki 通过端侧隐私过滤与 App 手动上传机制，确保数据流转的安全性。最终，物理世界的切片，被转化为结构化的「云端记忆库」。

如果说 GPT 是你工作的上下文，装载了人类的通用知识；那么 Looki 正在构建的，就是你生活的私有上下文，装载了你独一无二的经历与轨迹。

三、从「手动 Prompt」到「主动式 AI」

当语境足够丰富，交互终将进化为主动式「预判」。

目前硅谷普遍认为，我们终将迎来从 Chatbot 走向 Agentic AI（代理式 AI）的范式转移。行业预测显示，自主 AI 代理市场将在未来三年迎来爆发性增长，而 Memory（记忆）与 Context（上下文）正是这场进化的核心护城河。

Looki 的野心，正是基于这两者，通过可穿戴硬件构建通往「主动智能」的入口。

目前，Looki 交付给用户最显性的功能是「AI 自动剪辑」。它精准切中了那些热爱记录、却被后期剪辑劝退的用户痛点。用户在佩戴拍摄的同时，Looki 的算法自动识别一天中的高光时刻，自动生成有叙事逻辑的 Vlog。

基于这层理解，真正的质变在于「隐性洞察」。

随着记忆库的沉淀，Looki 将不再是被动等待指令的记录仪，而是能够进行推理的 Agent。它不仅记录你的饮食，更能在你点夜宵前，基于全天摄入主动发出「热量预警」；或在你情绪激动时，基于对话语境提供理性的沟通建议。

这种基于实时物理反馈的交互，让 AI 从「被动问答」进化为「主动共鸣」，这才是 AI 硬件区别于手机 App，能够真正接管用户生活的核心价值。

四、结语：当物理世界成为提示词

在 Looki 团队的构想中，硬件形态从来不是终点，而是一个「长在物理世界里的数据接口」。这也道出了 Looki 的实质：无论它今天是挂坠，还是未来演化为眼镜或耳机，其核心使命从未改变，那就是解决物理世界的数据饥渴，帮用户积累最宝贵的私有数据资产。

在 AI 时代，算力会被摩尔定律稀释，模型会被更强的版本迭代，但你在这个世界上生活过的痕迹、你眼中的风景、你与家人的对话，这些 Personal Context 构成了独一无二的你。而 Looki，就是帮你将这份资产，转化为 AI 能够理解共情的「数字直觉」。

当 AI 拥有了「在场感」，它就不再是云端那个冰冷的工具，而是你生活中的「第二大脑」。

最强大的 Prompt，其实是你未曾说出口的生活本身。

如果你想更深入地学习大模型，以下是一些非常有价值的学习资源，这些资源将帮助你从不同角度学习大模型，提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量

查看全文

http://www.cnnetsun.cn/news/92968.html

Molecular Operating Environment (MOE) 完整安装与配置指南

LobeChat能否用于生成直播话术？电商主播提词器

终极C++网络编程：构建高性能HTTP服务的完整指南

显卡驱动终极清理指南：一键彻底解决兼容性问题

Zotero GPT：用AI重新定义文献管理效率

LobeChat与LangChain结合应用：打造复杂AI工作流

突破60帧束缚：原神性能优化工具深度解析

云计算作业—-V L AN实验

当连锁巡检“听懂人话”：VLM技术下的智能运营新场景

责任链模式（Chain of Responsibility）：实现事件或请求的逐级处理与传递

SMUDebugTool深度探索：解锁AMD Ryzen系统的隐藏性能

JavaScript 中的单例模式：利用闭包、IIFE 或 ES Modules 实现线程安全的单例

CORS 机制中的预检请求（Preflight Request）：为什么 OPTIONS 请求总是先于复杂请求发送？

Google Drive文件下载终极指南：简单快速解决下载难题

面对一个新领域，如何快速摸清门道？试试“一键生成”研究地图

终极指南：5步实现全球付费内容免费阅读

GBase 8s数据库SYSTIMESTAMP表达式介绍（上）

从“秒级”到“毫秒级”：金仓如何让InfluxDB的“时序神话”黯然失色？

zotero-style插件深度解析：从零打造高效文献管理生态

5倍推理加速：Axolotl缓存策略如何终结重复计算瓶颈

LobeChat能否部署在华为云弹性云服务器？国产化替代实践

LobeChat备份与恢复策略：防止重要对话丢失

Access Token 生命周期管理：详细设计 Token 的获取、缓存、续期和过期处理机制

客户群 ID 与业务 ID 映射：设计高性能数据库表结构，实现 ChatID 与内部业务标签的快速关联

代码随想录算法训练营Day48 | 108.冗余连接、109.冗余连接II

微信网页版访问困境突破：3步安装wechat-need-web插件实战指南

MFC扩展库BCGControlBar Pro v37.1——支持Visual Studio 2026

知乎专题策划：LobeChat是否真的值得入手？

毕业论文AIGC全线飘红？揭秘5个“去AI化”核心手段，附保姆级工具清单

一、藏在 30g 机身里的「智能感知」系统

二、超越 RAG，搭建一套专属用户的「数据飞轮」

三、从「手动 Prompt」到「主动式 AI」

四、结语：当物理世界成为提示词

相关文章：