News

Psyche网络利用区块链技术,汇聚全球计算资源,成功启动了40B参数大语言模型Consilience的预训练任务,总计20万亿token,创下了迄今为止互联网上最大规模的预训练纪录。 大语言模型Consilience采用DeepSeek ...
别人都在用 X 发帖子,分享新鲜事物,微软副总裁 Nando de Freitas 却有自己的想法:他要在 X 上「开课」,发布一些关于人工智能教育的帖子。该系列会从 LLM 的强化学习开始,然后逐步讲解扩散、流匹配,以及看看这些技术接下来会如何发展 ...
然而,来自上海交通大学和 SII 的最新研究却给出了一个非共识答案:仅需 312 条人类标注轨迹,使用 Claude 3.7 Sonnet 合成更丰富的动作决策,就能激发模型 241% 的性能,甚至超越 Claude 3.7 Sonnet ...
Builder.ai自称用AI简化软件开发,吸引微软、软银等巨额投资,估值一度超15亿美元。但实际靠人工冒充AI,创始人虚报三倍营收。丑闻曝光后,投资被冻结,公司原地破产。
微软CTO(首席技术官)Kevin Scott拥有41年编程经验,亲身经历了现代软件开发每一次重大技术变革。而Agent智能体作为下一代互联网最重要的技术之一,微软几乎在所有产品矩阵中都增加了相应的功能,非常重视智能体的应用和发展。
深圳市大数据研究院、香港中文大学(深圳)研究团队最新研究发现, 这类特殊的矩阵乘法可以进一步加速,并在强化学习与组合优化技术的结合下发掘出了一种新的算法,节省 5% 的乘法数量。 矩阵乘法优化堪称计算机科学领域的「珠穆朗玛峰」。自 1969 年 ...
来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。
星际之门基建项目的核心人物,是Chase Lochmiller。他的另一个身份,是数据中心初创公司Crusoe的创始人,而Crusoe正负责监督这个庞大的项目。
指令遵循(instruction-following)与数学推理能力(mathematical reasoning)之间存在一种权衡关系(trade-off)。也就是说,当模型在推理能力上表现得更强时,它往往更容易忽略或违反用户的具体指令。
Bug本身只是一个正则表达式的小问题,被分配给一位微软员工斯蒂芬和Copilot合作解决。 微软著名开源项目.NET Runtime成了吃瓜现场,全球程序员在GitHub评论区围观嘲笑: 微软用垃圾AI折磨微软员工,真是可悲又可笑。 发生什么事?
随着GenAI引入数据安全挑战,同时也为加强防御提供了战略机遇,其日益增长的整合标志着企业从实验阶段向更成熟、更运营化的部署转变。尽管大多数受访者表示采用GenAI是他们的首要安全担忧,但处于更高级AI采用阶段的受访者并不会在完全保障系统安全或优化技 ...
随着经济决策继续波动,创造了一个极具挑战性的全球贸易格局,企业必须认识到采取主动风险管理策略以保护其供应链的必要性。通过利用AI驱动的分析来预测潜在的中断,并利用自主式AI来应对这些中断,企业可以最大限度地减少关税的影响,保护其收入来源,并构建更具韧 ...