12月16日,有媒体报道字节跳动一直在秘密使用OpenAI的技术来开发自家大语言模型(LLM)。OpenAI发言人Niko Felix称已经暂停了字节跳动的账户。
字节跳动发言人Jodi·Seth回应表示,GPT生成的数据在“种子计划”(Project Seed)开发的早期被用于对模型进行注释,已在今年年中左右从字节跳动的训练数据中删除。
声明说:“字节跳动通过微软获得了使用GPT API(应用程序编程接口)的许可。我们使用GPT为非中国市场的产品和功能提供动力,但使用我们的自研模型为豆包AI提供动力,豆包仅在中国上市。”
外媒称从字节跳动内部获取的一份文件了解到,字节跳动在代号为“种子计划”的大语言模型项目中,几乎每个开发阶段都依赖OpenAI的API来进行开发,包括训练和评估模型。
“种子计划”大约在一年前启动,目前主要研发两个产品,一个是在国内已经上线的豆包;另一个是针对商业用户的聊天机器人平台,目前正在开发中。
该报道发出后,OpenAI发言人Niko Felix称:“虽然字节跳动使用我们API的量很少,但我们已经暂停了他们的账户,同时我们会进一步调查。如果我们发现他们的使用不符合规则,我们将要求他们进行必要的更改或终止他们的账户。”
上述“规则”是指在OpenAI服务条款中的一项明确规定,即OpenAI提供的模型能力,不允许用来被“开发任何与之产品和服务形成竞争的AI模型”。字节跳动通过微软购买了OpenAI的访问权限,但微软也制定了与OpenAI同样的条款。
微软发言人Frank Shaw在一份声明中表示:“Azure OpenAI服务等微软的AI解决方案属于我们有限访问框架的一部分,这意味着所有客户都必须申请并获得微软的批准才能访问。我们还制定了标准并提供资源,帮助我们的客户负责任地使用这些技术,并遵守我们的服务条款。我们还制定了发现滥用行为的流程,并在企业违反我们的行为准则时停止他们的访问。”
在今年的“百模大战”中,字节跳动被外界视为“慢半拍”,声量也不算大。6月,字节跳动火山引擎发布大模型服务平台——火山方舟,运营模式是在一个平台内提供多个模型,让企业用户同步试用,并选用更适合自身业务需要的模型组合。字节跳动自研的通用大模型“云雀”直到今年8月才在首批通过《生成式人工智能服务管理暂行办法》大模型名单中露出。8月17日,基于云雀大模型的AI对话产品“豆包”正式开启对外测试。
豆包AI官微介绍,豆包AI可以提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页Web平台,iOS以及安卓平台。豆包能提供自然语言处理、知识理解、对话、信息检索、情感分析、机器学习等多种类型的帮助。
相关报道被曝秘密使用OpenAI技术字节跳动回应:小规模应用于实验性项目 4月已停止
字节跳动回应被OpenAI封禁账户:正与OpenAI联系沟通 澄清误解