English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
1:03:33
Oscar: Object-Semantics Aligned Pre-training for Vision-Language T
…
2020年5月4日
Microsoft
1:20
Reinforced Cross-Modal Matching and Self-Supervised Imitation Lear
…
2018年11月27日
Microsoft
DINOv3: A Next-Gen Vision Model via Self-Supervised Learning | Op
…
5 个月之前
linkedin.com
0:12
In vision-and-language pretraining (VLP), objects can be used as anc
…
已浏览 2.3万 次
2020年5月15日
Facebook
Microsoft Research
24:50
Research talk: Large-scale, self-supervised pretraining: From lang
…
2021年11月16日
Microsoft
1:27:56
NICE Session 80: ICCV 2025 Paper Sharing Session 2
已浏览 50 次
3 个月之前
YouTube
NLP Academic Exchange Platform
36:03
Computer Vision: Did one breakthrough change everything?
2 个月之前
YouTube
Big Ideas Only
7:23
Robot Foundation Models - The Path from RT-1 to RT-2 | Uplatz
已浏览 1 次
1 个月前
YouTube
Uplatz
0:37
Vision Language Models #GlobalSensorAwards#sensorawa
…
1 个月前
YouTube
Global Sensor
6:44
The Future of AI That Thinks Before It Speaks | VL-JEPA Explained: Ho
…
已浏览 87 次
1 个月前
YouTube
Neural Nexus
4:25
#20. Types of Foundation Models
已浏览 16 次
1 个月前
YouTube
Tech With Mala
2:14
A Survey of Large Language Model Architectures and Their Impact o
…
已浏览 4 次
1 个月前
YouTube
Paper to PPT : Natural Language Processing
13:20
Vision Encoders in Vision-Language Models: A Survey
已浏览 83 次
1 个月前
YouTube
AI Papers Podcast Daily
12:49
RynnVLA-002: A Unified Vision-Language-Action and World Mode
…
已浏览 28 次
2 个月之前
YouTube
AI Papers Slop
1:10
What is Self-Supervised Learning?
2 个月之前
YouTube
Data Science Made Easy
0:41
VaulTech on Instagram: "End of LLMs? VL-JEPA stands for Vision
…
已浏览 386 次
1 个月前
Instagram
vaultechi
Stanford Seminar - Robot Learning in the Era of Large Pretrained Mod
…
已浏览 1万 次
2024年3月13日
YouTube
Stanford Online
UrbanCLIP: Learning Text-enhanced Urban Region Profiling with Contr
…
2024年4月29日
acm.org
HKML S3E11 - FinBERT: A Pretrained Language Model for Fi
…
已浏览 2357 次
2021年6月26日
YouTube
HKML
Large Vision Language Models Tutorial for BRAILS ++
已浏览 587 次
2024年9月12日
YouTube
NHERI DesignSafe
2:29:42
逐篇解析机器人基座模型和VLA经典论文(含投屏版)——“人就是最智
…
已浏览 3500 次
10 个月之前
YouTube
張小珺Xiaojùn Podcast
1:42:09
ICCV 2025论文分享 第二场
已浏览 643 次
5 个月之前
bilibili
NICE学术
23:33
A Survey on Efficient Vision-Language-Action Models(TJU 2025)
已浏览 717 次
3 个月之前
bilibili
mardinff
59:35
A Survey on Large Multimodal Reasoning Models-2-多模态大模型
…
已浏览 1568 次
5 个月之前
bilibili
小林绿子的怀中猫
22:57
多模态经典论文集7:BEiT-3
已浏览 3301 次
9 个月之前
bilibili
DeepFinder
1:35
开源!首个原生3D高斯大模型SceneSplat,端到端解锁万物识别
…
已浏览 4835 次
5 个月之前
bilibili
深蓝学院
3:03
一体式多模态大模型VL-BEIT做了什么?BERT有什么优点?
已浏览 776 次
2024年6月14日
bilibili
Ph-D-Vlog
4:07
2024最新大模型科研分享!10篇全新论文带你激发研究灵感,建议火速收
…
已浏览 1245 次
2024年7月3日
bilibili
账号已注销
48:07
OpenAI CLIP: ConnectingText and Images (Paper Explained)
已浏览 16.9万 次
2021年1月12日
YouTube
Yannic Kilcher
15:57
从零开始“看懂”世界:DINOv3如何让AI学会视觉?
已浏览 5481 次
5 个月之前
bilibili
极市平台
观看更多视频
更多类似内容
反馈