行业大模型训练需求梳理

    近年来大模型正在席卷各行各业,一方面大家在鼓吹AGI已经到来、各行各业都可以享受到技术的红利,另一方面媒体上不断贩卖焦虑、许多行业面临着失业下岗的挑战。
    我们是一家小型初创公司,目前聚焦在AIGC赛道,在文本、图像等生成方向都有较多积累,在电商、文旅文案生成以及智能问答等业务领域都有成熟大模型应用的落地,我们信奉技术给客户带来价值,既不会过度鼓吹,也不会贩卖焦虑,期望通过我们的努力来为您揭开技术的神秘面纱,真正为您的现实业务赋能、带来业务的增长、用户价值的提升。
    这次问卷调查旨在了解大家的现实诉求,方便将我们沉淀的技术能力重塑裁剪服务各行各业的业务形态,为您的业务量体裁衣、来一次大模型技术的加持和改造吧!
*
1.
您需要用大模型解决的问题/任务是什么?
用于文本续写,比如广告文案生成、诊断意见生成等
用于人机对话,比如类似ChatGPT在对话过程中解决多种问题
经典 NLU 任务,如文本分类、意图识别、实体识别等任务
多阶段任务,如无监督+有监督微调
其它任务
*
2.
您是否有自己的行业或者领域数据?【多选题】
有行业语料数据,即某个行业的纯文本类型数据
有行业标签数据,即某个具体行业任务的标注数据集
*
3.
如果您有自己的行业/领域数据,数据规模多大?
MB级别
GB级别
TB级别
*
4.
您需要训练的模型参数规模是怎样的?
亿级别参数量(100M)
十亿级别参数量(1B)
百亿级别参数量(10B)
千亿级别参数量(100B)
*
5.
除了模型的训练优化,您有没有业务上定制化的需求要解决?【多选题】
外挂知识库、增强模型对特定业务的事实性理解能力,比如企业内部或者公开知识库
物料库的检索,比如在业务流程中需要召回商品、视频、服务等物料
智能客服QA,含特定业务FQA、业务多轮对话等
其它定制化需求
*
6.
您期望以哪种方式来对大模型训练效果进行验收?
公开评测集上分数达标
您的私有评测集上分数达标
您提供人力进行case抽查
借助ChatGPT进行双盲测
其它方式验收
7.
您对ChatGPT怎么看,它是否可以解决您当前的问题,ChatGPT对您的问题来说不足之处是什么
8.
如果能够按照您前面提交的需求,解决您问题的话,您预算花费的大概范围是多少(万元)?
9.
您如果愿意可以留下联系方式,方便后续工程师跟你对接,或者微信联系我们:wikifier
微信、电话号码、邮箱均可
问卷星提供技术支持
举报