📊 广泛评估表现: 在16个已知数据集中,DocLLM在多种文档智能任务中表现优越,对未见数据集具有强大泛化能力。
每个AI工程师仍然需要强大的软件工程基础。将LLM应用程序交付给prod,就等同于软件工程。
论文网址:https://arxiv.org/pdf/2401.00431.pdf
站长之家(ChinaZ.com)1月4日 消息:斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性,远远超过了GPT-4的66.1%。此外,WikiChat还在相关性、信息性、自然性、非重复性和时间正确性方面领先其他模型。
新融资将主要用于扩大Robin AI在美国和亚太地区的业务。这标志着公司在全球范围内推动其AI法律合同解决方案的全球化战略。淡马锡控股有限公司作为新一轮融资的领头投资者,显示了投资者对Robin AI技术和商业前景的强烈信心。