010-61503882

首页 > Model Zoo > Vit_tiny-Pytorch
Vit_tiny-Pytorch
图像 视觉 分类
2024-06-04 | 2205人看过
模型信息

Vision Transforme,一个简单的方法来实现SOTA的视觉分类,只有一个单一的变压器编码器。提出了一种新的图像到补丁函数,该函数在对图像进行归一化并将图像划分为多个补丁之前,将图像的偏移量纳入到图像到补丁函数中。

论文:[《Vision Transforme》](https://openreview.net/pdf?id=YicbFdNTTy)

开源模型链接:https://github.com/lucidrains/vit-pytorch.git

数据集(ImageNet):http://www.image-net.org/


发表评论
全部评论(0)