未分类Mastering Multi-Drone Volleyball throughHierarchical Co-Self-Play Reinforcement Learning 一、研究背景与挑战 任务定义:3v3 多无人机排球(Multi-Drone Volleyball)该任务要求三台无人机组成一个团队与另一个三机团队进行排球比赛。它同时具有以下挑战性: 高层策略与低层控制耦合:需要在物理环境中做出战术决策(如团队配合、球路选择)并执... hcl 2天前
区块链Sailfish: Towards Improving the Latency of DAG-based BFT N. Shrestha, R. Shrothrium, A. Kate and K. Nayak, “Sailfish: Towards Improving the Latency of DAG-Based BFT,” 2025 IEEE Sympos... 韦帆 3天前
人工智能DiffFP: Learning Behaviors from Scratch via Diffusion-based FictitiousPlay 作者:Akash Karthikeyan, Yash Vardhan Pant 问题背景与动机 自我对弈(self-play)强化学习在博弈性和多智能体任务中已被证明能够学习复杂策略,但在连续动作空间、对手多样性 以及 泛化性 方面仍存在显著挑战,包括: 传... hcl 1周前 (12-12)
区块链ContribChain: A Stress-Balanced Blockchain Sharding Protocol with Node Contribution Awareness X. Huang et al., “ContribChain: A Stress-Balanced Blockchain Sharding Protocol with Node Contribution Awareness,” IEEE INFOCOM... 韦帆 1周前 (12-12)
互联网PhyDNNs: Bringing Deep Neural Networks to the Physical Layer 打破传统边界,让 AI 更快更省能——PhyDNNs 正在重塑通信与智能终端未来! 在智能设备与实时交互应用高速发展的今天,从增强现实 (AR) 到虚拟现实 (VR),从智能驾驶到无人机,都对实时计算提出了前所未有的要求。然而,深度神经网络(DNN)传统的... 前康 1周前 (12-11)
人工智能A Survey on Self-Play Methods in Reinforcement Learning 论文要点 论文提出了一个统一框架来刻画 self-play(智能体与自身或自身历史版本交互以改进策略)的各种方法,按策略更新机制、对手选择与人口管理、博弈类型(零和/非零和、可转性/非可转性)等维度进行分类,并回顾了代表性算法、应用场景与理论/实践挑战,同时列出了未来研究... hcl 2周前 (12-05)
互联网m3: Accurate Flow-Level Performance Estimationusing Machine Learning 当网络仿真不再“慢 + 重” —— m3 带来突破 在现代数据中心或云服务架构中,网络性能 — 尤其是流 (flow) 完成时间 (Flow Completion Time, FCT) 和尾部时延 (tail latency) — 是决定用户体验和资源效率的关键指标。过去... 前康 2周前 (12-04)
区块链HotStuff: BFT Consensus in the Lens of Blockchain Yin M, Malkhi D, Reiter M K, et al. HotStuff: BFT consensus in the lens of blockchain[J]. arXiv preprint arXiv:1803.05069, 2018. 在谈论区块... 韦帆 3周前 (12-03)
人工智能A Survey of Generative Categories and Techniques in Multimodal Generative Models 论文目的 系统回顾 “多模态大语言模型 (Multimodal Large Language Models, MLLMs)” 的研究进展 — 即那些不仅处理文本 (text),还能处理 / 生成图像 (image)、音乐 (music)、视频 (video)、人体动作 (... hcl 3周前 (11-28)
区块链LBFT-DAG:一种快速的、领导者驱动的、具拜占庭容错性的联盟链DAG区块链 Dong X, Liu Y, Li T, et al. LBFT-DAG: A Swift, Leader-Driven, DAG-Based Consortium Blockchain with Byzantine Fault-Tolerance[C]//IEEE INFO... 韦帆 3周前 (11-27)