Are Pre-trained Convolutions Better than Pre-trained Transformers?

https://arxiv.org/abs/2105.03322


Publié

dans

par

Étiquettes :