导航更多
当前您所在的位置:首页 » 专栏

人工智能与元宇宙产业委《元宇宙十大技术》培训班第128期

央链直播 +关注 2026-01-12 97
分享

 

人工智能与元宇宙产业委《元宇宙十大技术》培训班第128期:刘宇《生命演化和语言模型中的“算法信息”》

2025年12月14日周日晚上八点,由人工智能与元宇宙产业委(“中国移动通信联合会人工智能与元宇宙产业工作委员会”的简称)指导,人工智能与元宇宙产业委副主任委员兼联席秘书长、物链芯工程技术研究院元宇宙研究所所长叶毓睿创办的“燕园叶话”《元宇宙十大技术》培训班进行到第128期。微信视频号 乐生活与爱IT、央链直播、寇享学术、DOIT、零壹财经、iCloser社交元宇宙、卢米宇宙、察访区块链、web3马甲哥、上海创业导师、盘古智库、氦川科技、大江大湖大黄高、卢山说AI精进、凤岐茶社等媒体直播或转载。客座嘉宾刘宇讲解《生命演化和语言模型中的“算法信息”》,本期超4526人在线观看。

燕园叶话欢迎大家一起打造AI培训平台,加入到这个AI全民科普计划(十个顶级专家,百个中高级的资深专家;千个甚至万个最高层,也即5~6层AI老师。无论是AI老师,或者需要培训的甲方,都欢迎和我私信联系、探讨。用Web3/DAO的方式,看看如何达成共识分润?

 

会议纪要:

先分享几张讲稿截图,下载完整讲稿,请订阅 燕园叶话 知识星球。

 

 

使用AIGC工具或平台帮助整理出的会议纪要如下(感谢 邵舸同学):

1)演讲者观点总结

 

刘宇教授在本次研讨会中,从物理和数学的交叉视角出发,系统探讨了生命演化和语言模型中的算法信息问题。

 

他的核心观点是:生命和智能的本质可以通过算法信息论来理解,其中最小描述长度原理(如柯氏复杂度)扮演关键角色。刘教授认为,生命系统(如DNA序列)和智能系统(如语言模型)都遵循“最简单算法生成”的原则,即演化过程倾向于通过复用(reuse)和修修补补(tinkering)来最小化描述复杂度。他强调了压缩与智能的直接关联——例如,语言模型对数据的无损压缩效率越高,越能体现其对数据的深层理解。

 

此外,刘教授介绍了其团队开发的“梯径方法”(Ladderpath),该方法通过计算生成序列的最小步骤数来量化复杂度,并已应用于DNA模型、蛋白质组分析等场景,验证了算法信息约束在自然系统中的普适性。

 

整体上,刘教授的观点突出了信息论在解释生命和智能演化中的桥梁作用,并为跨学科研究提供了可计算框架。

 

2)演讲内容大纲

 

刘宇教授的演讲以“生命演化和语言模型中的算法信息”为主题,分为三个主要部分。

 

1. 引子部分

 

刘教授以两个基本问题引入话题。首先,他探讨“什么是生命”,引用NASA的定义(生命是能进行达尔文演化的自我维持化学系统),并指出该定义的模糊性;通过计算机病毒、生物病毒和人体等例子,他质疑生命定义的尺度依赖性,强调生命可能更本质地是一个信息问题而非纯生物学问题。

 

其次,他讨论“什么是智能”,以二进制字符串的理解为例,说明“理解”的本质是找到最短描述来复现数据,而非机械记忆;这引出了奥卡姆剃刀原则和算法信息论的基本思想。

 

2.信息压缩与算法信息论部分

 

刘教授对比了香农熵和柯氏复杂度。香农熵适用于独立同分布数据,但无法捕捉序列中的结构信息;而柯氏复杂度(通过最短程序长度定义)能更好描述真实序列的复杂性,尽管它不可计算,但可通过压缩算法(如gzip或BPE)逼近。

 

他重点分析了语言模型与压缩的关联,引用DeepMind等研究指出,大语言模型结合算术编码可实现高效无损压缩,且压缩率与模型大小正相关,这暗示语言模型是逼近柯氏复杂度的实用工具。

 

此外,他解释了所罗门诺夫归纳和通用先验,说明智能系统在有限信息下逼近最小描述长度的能力。

 

3. 算法信息对生命和智能的约束部分

 

刘教授通过直觉案例(如无人机演化中的模块复用)说明自然系统倾向于“经济”的生成路径。他详细介绍了梯径方法——一种基于复用和修修补补的可计算复杂度度量,该方法将序列生成建模为最小步骤操作,并输出复杂度指标和层次结构。

应用案例包括:化学分子复杂度分析、神经网络架构优化、蛋白质演化研究以及多肽药物设计。

 

最后,他展示了梯径方法在DNA语言模型Tokenizer改进中的成果,指出其比传统BPE更高效,凸显了算法信息约束在生物信息学中的潜力。

3)问答环节

 

1. Peter叶毓睿提问

 

Peter问及生命特质(如复制和代谢)是否对应算法中的复用和修修补补概念?

刘宇教授肯定了这一映射,指出复制与复用高度相关,但代谢更复杂,需结合具体场景分析。

 

Peter询问Deep Seek等AI模型是否借鉴了生物演化原理?

刘教授表示未深入研究DeepSeek底层,但复用思想在AI中很常见,可能无意识被应用。

 

Peter探讨马斯克“虚拟世界”观点。

刘教授认为该问题无法证伪,若无法感知虚拟性则无实际意义,更倾向于关注宇宙的基本法则。

 

Peter问AI理解应适应计算机还是人类逻辑。

刘教授强调智能形式多样,但为实用起见,AI需可解释性以避免“黑箱”风险,如算命先生式不可靠输出。

 

Peter质疑无损压缩是否适用于所有字符串。

刘教授解释压缩依赖训练数据覆盖性,例如英文压缩需包含字母表,否则效率受限。

 

2. 邵舸David提问

 

邵舸请刘教授阐释“信息约束”概念。

刘教授以蛋白质出现概率为例,说明算法越简单(柯氏复杂度越低),实体越易在自然界出现,这体现了信息对演化的定量约束。

 

邵舸问语言模型在刘教授研究中的作用?

刘教授指出,其团队通过梯径方法优化DNA语言模型的Tokenizer(分词器),仅改动分词策略而非神经网络本身,就提升了模型效果,这启示研究者关注数据预处理而非盲目扩增模型规模。

 

 

下期预告:

人工智能与元宇宙产业委《元宇宙十大技术》培训班

第129期(2025年12月21日,周日20点)

郑凛(深海):《AI与无我:人人可以开悟的时代要来了吗?》

 

1、腾讯会议:576-2467-9700 (密码: 230101)

2、 B站 http://live.bilibili.com/32509301

 

人工智能与元宇宙产业委《元宇宙十大技术》培训班是由人工智能与元宇宙产业委副主任委员兼联席秘书长、物链芯工程技术研究院元宇宙研究所所长、先进计算产业发展联盟智能计算组组长叶毓睿发起和创办的。叶毓睿长期关注区块链、VR/AR、AIGC、数字孪生、3D内容创作平台或规范(如Web3D、WebXR)等元宇宙等前沿技术领衔参与撰写的《元宇宙十大技术》一书系统地剖析了构成元宇宙的技术组成、原理、案例和未来趋势。他领衔并邀请了十多位领域的Top级专家撰写的《元宇宙十大技术》一书,系统地剖析了构成元宇宙的核心技术要点,该书得到了包括朱嘉明、肖风、姚前及四位院士等70多位资深专家的联袂推荐。 通过“燕园叶话”这个平台,叶毓睿希望能够推动元宇宙技术在社会各界的交流与普及。《元宇宙十大技术》一书为这个系列活动提供了理论基础和技术支撑。同时,叶毓睿还积极运用自己的人脉资源,邀请国内外元宇宙领域的专家学者前来主讲,保证了内容的专业性和前瞻性。截止2025年12月14日,已经举办了第128期,促成了不少合作,欢迎关注、转发。通过关注视频号 乐生活与爱IT,可以查看过往回放。

 

 

 

 

 

 

 

 

 

 

人工智能与元宇宙产业委《元宇宙十大技术》培训班目前主要以线上形式(腾讯会议+视频号)展开,并邀请了13+媒体伙伴们一起转播、转载,通常每次在线观看人数4000-41000不等,也是受访嘉宾及其所在公司的良好展示平台。该品牌系列活动的创办,是元宇宙产业委和叶毓睿推动元宇宙产业发展、促进元宇宙技术交流的重要举措之一。 《元宇宙十大技术》培训班的举办,是元宇宙产业委为推动元宇宙技术交流、促进产业发展作出的重要努力。通过持续邀请专家学者主讲,剖析元宇宙技术,和介绍应用场景或案例,使广大公众对元宇宙有了更深入的了解,也增强了对元宇宙发展的信心。可以预见,这一系列活动有望对元宇宙产业链培育人才、推动技术创新、规范产业发展起到积极的推动作用。我们期待它能够发挥引领示范效应,推动元宇宙产业健康快速发展。

0

好文章需要您的支持

声明:

根据《中华人民共和国著作权法》及《最高人民法院关于审理涉及计算机网络著作权纠纷案件适用法律若干问题的解释》的规定,本网站声明:凡本网转载作品,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,转载信息版权属于原媒体及作者。我们力所能及地注明初始来源和原创作者,如果您觉得侵犯了您的权益,请通知我们,我们会立即删除改正。如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

收藏
分享
发表评论:
评论:
最新专栏