010-61503882

首页 > Model Zoo > Vit_tiny-Pytorch

Vit_tiny-Pytorch

图像视觉分类

2024-06-04 | 2205人看过

立即下载

模型信息

Vision Transforme，一个简单的方法来实现SOTA的视觉分类，只有一个单一的变压器编码器。提出了一种新的图像到补丁函数，该函数在对图像进行归一化并将图像划分为多个补丁之前，将图像的偏移量纳入到图像到补丁函数中。

论文：[《Vision Transforme》](https://openreview.net/pdf?id=YicbFdNTTy)

开源模型链接：https://github.com/lucidrains/vit-pytorch.git

数据集（ImageNet）：http://www.image-net.org/

发表评论

全部评论（0）