首页 > 资讯

最大CLIP!LAION发布CLIP的扩增定律

2022-12-24 01:24:57


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143
上一篇 下一篇
热文推荐 更多

最大CLIP!LAION发布CLIP的扩增定律

2022-12-24

中国银行深耕养老场景生态,全方位发力个人养老金业务 世界快看点

2022-12-23

世界快讯:新鲜黄花胶怎么晒干保存 花胶怎么保存呢 -

2022-12-23

池州车祸死亡赔偿律师一般收费多少?-环球新资讯

2022-12-23

振华股份(603067.SH):蔡再华已通过集中竞价减持409.26万股

2022-12-22

易维哲:黄金高位震荡,原油还有上涨空间

2022-12-22

邮储银行普惠金融部总经理耿黎:数字科技助力普惠金融实现商业可持续-焦点短讯

2022-12-21

《写给孩子的宋韵百讲》出版!带孩子赴一场宋韵之旅

2022-12-21

勤俭节约成校园文明新风尚 简讯

2022-12-21

ST开元收关注函:要求说明资生环保拟投资卤水制备碳酸锂生产线扩建项目的具体金额及项目进展情况 世界速看料

2022-12-20

【天天快播报】杭州热电董秘回复:我司一贯高度重视环保问题,据您反映的情况

2022-12-20

今日热搜:【机构调研记录】富安达基金调研大元泵业、中科江南等7只个股(附名单)

2022-12-20

专家共论区域优势互补 探索治理“大城市病”优化开发模式 世界新资讯

2022-12-19

东旭蓝天董秘回复:公司已于2022年10月27日披露了2022年第三季度报告,敬请查阅

2022-12-19

从19岁到35岁,梅西值得!

2022-12-19

央行:2023年的货币政策总量要够 结构要准 短讯

2022-12-18

全球速递!兔年本命年2023年要佩戴什么 兔年本命年2023年需要佩戴什么

2022-12-18

【建议收藏】重磅!2023年无锡市物联网产业链全景图谱(附产业政策、产业链现状图谱、产业资源空间布局、产业链发展规划) 世界观速讯

2022-12-17

天天快讯:福建完善机制源头治理欠款欠薪

2022-12-16

判多少年缓多少年

2022-12-16