未分类无人机群协同目标搜索的多智能体强化学习方法 Y. Hou, J. Zhao, R. Zhang, et al. UAV Swarm Cooperative Target Search: A Multi-Agent Reinforcement Learning Approach[J]. IEEE Transactions... hcl 19小时前
未分类NeurIPS唯一满分论文曝光,来自清华上交 四个审稿人全给6分,NeurIPS唯一满分论文炸了! 之所以说它炸,主要是论文给出的结论实在太出人意料了—— 真正决定推理上限的是基座模型本身而非强化学习,且蒸馏比强化学习更有望实现大模型自我进化。 好家伙,这无异于给正炙手可热的RLVR(可验证奖励的强化学习... hcl 19小时前
未分类李飞飞和LeCun的世界模型之争 Jay 发自 凹非寺量子位 | 公众号 QbitAI AGI之路,终于交汇到了世界模型的战场。 李飞飞,发布了旗下首款商用世界模型Marble; 几乎同一时间,Lecun离职Meta,准备创立自己的世界模型公司; 在此之前,谷歌旗下的世界模型Geni... hcl 19小时前
web3.0BlockSDN-VC: 基于SDN与虚拟坐标的高性能区块链交易广播框架 BlockSDN-VC 是一个面向高性能区块链的创新型交易广播框架。它针对传统区块链(如比特币、以太坊)中基于Gossip协议的交易广播机制所形成的性能瓶颈,提出了一种根本性的解决方案。该框架的核心思想是将虚拟坐标系统的计算从不可靠、易受攻击的P2P节点层“提升”至拥有全局网络... 中文社区管理员 1周前 (11-06)
web3.0LLM-Enhanced Heterogeneous Graph Embedding Model for Multi-Task DNS Security 《LLM-Enhanced Heterogeneous Graph Embedding Model for Multi-Task DNS Security》融合大语言模型的异构图嵌入(Heterogeneous Graph Embedding)DNS安全多任务检测域名系统(DN... 中文社区管理员 2周前 (11-04)
人工智能Nature 强化学习AI超越了人类设计的算法! 强化学习是人工智能领域的核心技术之一,其基本原理模拟了生物学习的本质:通过与环境互动、接收反馈并调整行为来提升性能。从AlphaGo击败围棋世界冠军,到ChatGPT展现出惊人的语言能力,背后都离不开强化学习的支撑。然而,长期以来,这些系统的学习规则都需要人类专家精心设计和调优... 中文社区管理员 3周前 (10-29)
互联网ICNP 2025论文报道 之 AI4Net 第 33 届 IEEE ICNP 于 2025 年 9 月在韩国首尔召开,本次大会共计 238 篇投稿,录用 60 篇(录用率为 25%)。 《Mamba4Net: 蒸馏式混合Mamba大语言模型在网络领域的应用》论文介绍 《Mamba4Net: Distilled... hcl 1个月前 (10-11)
新型网络体系结构IEEE INFOCOM2025开源文|好文荐读!HyperJet: 分布式边缘计算中超图任务的联合通信与计算调度 摘要 分布式边缘计算(DEC)因其在通信延迟、并行计算效率和能耗方面的卓越性能,已成为一种新的计算模式。随着生成式人工智能任务的激增,DEC 对并行计算效率提出了更高的要求。安排多个任务同时处理,而不是逐个处理,可以提高并行效率。多个任务具有多重依赖性,即序列依赖性、属性... hcl 2个月前 (09-29)
人工智能ByteScale: Communication-Efficient Scaling of LLM Training with a 2048K Context Length on 16384 GPUs Hao Ge (Peking University); Junda Feng, Qi Huang (ByteDance Inc.); Fangcheng Fu (Shanghai Jiao Tong University); Xiaonan Nie, Lei Zuo, Haib... hcl 2个月前 (09-15)
互联网CASSINI: Network-Aware Job Scheduling in Machine Learning Clusters 作者:Sudarsanan Rajasekaran (1), Manya Ghobadi (1), Aditya Akella (2) ((1) Massachusetts Institute of Technology, (2... hcl 3个月前 (08-14)