【微软研究人员探索使用儿童故事训练微小语言模型,发现其能迅速学会讲述连贯且符合语法的故事,为训练大型模型提供了新的研究方向。】在人工智能领域,理解和改进神经网络的行为一直是一个挑战。大型语言模型如ChatGPT的训练成本高昂,而微软研究人员提出了一个新的方法:使用儿童故事来训练微小模型,以此模拟神经网络的学习过程。这种方法的灵感来自于果蝇基因组测序与人类基因组测序的类比。研究人员在较小的数据集上训...