searchusermenu
  • 发布文章
  • 消息中心
范****铭
2 文章|0 获赞|0 粉丝|13 浏览
社区专栏视频问答关注
全部文章Ta的评论
  • 机器学习的最新突破主要归功于规模的扩大:即前所未有规模的大型注意力机制架构和数据集。这篇论文探讨了在国际象棋中大规模训练的影响。与依赖复杂启发式方法或显式搜索的传统国际象棋引擎不同,研究人员使用监督学习训练了一个拥有2.7亿参数的变压器模型,并在1000万盘棋局的数据集上进行训练。通过使用强大的Stockfish 16引擎对每个棋盘进行动作价值标注,该模型达到了2895的Lichess快棋Elo评分,并成功解决了一系列挑战性的国际象棋难题,且无需任何特定领域的调整或显式搜索算法。实验还表明,该模型在没有蒙特卡罗树搜索的情况下,表现优于AlphaZero的策略和价值网络以及GPT-3.5-turbo-instruct。系统的模型和数据集规模研究表明,只有在足够的规模下才能实现强大的国际象棋性能。
    范****铭
    2024-06-24
    9
    0
  • 在弱监督学习领域,对象定位任务一直是一个挑战性问题。传统的基于伪标签的方法虽然取得了一定的进展,但往往忽略了如何有效利用这些可能带有噪声的标签。本文提出了一种新颖的弱监督对象定位方法——噪声标签学习下的弱监督对象定位,通过清洗有缺陷的标签并优化其应用方式,显著提升了对象定位的性能。
    范****铭
    2024-05-28
    4
    0
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 2 篇文章
文章获得 0 次赞同
文章被浏览 13 次
获得 0 人关注
个人荣誉查看规则
暂未获得荣誉