Vae Autoencoder - 搜索 News

基于条件生成对抗网络与注意力机制的多层感知器融合模型在埋地 ...

本文创新性地提出融合变分自编码器(VAE)和条件生成对抗网络(cGAN)的VAE-cGAN数据增强模型，结合注意力机制增强的多层感知器(MLP-Attention)，有效解决埋地油气管道腐蚀数据样本稀缺难题。实验表明，该方法使RMSE和MAPE分别降至0.0153和0.1041，R2提升至0.9787，生成数据 ...

新浪网

MIT用AI生成3600万种化合物，其中两种化合物展现独特杀菌机制

世界顶级合成生物大佬也开始研究 AI 课题，并利用 AI 生成了尚未被发现或压根不存在的假设性化学分子。也就是说，AI 从零开始凭空创造出了任何数据库中都不存在的全新分子结构，实现了抗生素的从头设计。具体来说，美国麻省理工学院詹姆斯·柯林斯（James ...

Microsoft

CausCell：虚拟细胞进入“白盒时代”

编者按：在生命科学研究中，逼真且可解释的细胞模型一直备受期待。但现有的单细胞 AI 建模多依赖于深度神经网络等“黑盒”方法，难以解开高维组学数据背后的生物学因果机制。近日，微软亚洲研究院（上海）与同济大学合作在《自然-通讯》（Nature ...

东北大学

NEU Professor Xu Wei’s Team Publishes Series on AI-Powered Microstructure Analysis and ...

In the past two months, Professor Xu Wei’s team at the State Key Laboratory of Digital Steel, NEU, published four high-quality research papers across three consecutive issues of Acta Materialia, ...

生物通

HVQ-VAE：带双曲向量量化的变分自编码器 —— 探索双曲空间在离散隐 ...

针对 VQ-VAE 在欧氏和球面隐空间的局限，研究人员开展双曲空间几何先验对其学习能力提升的研究。提出 HVQ-VAE，使隐嵌入和码本在双曲庞加莱球学习。实验表明其图像重建更优、码本利用高效、收敛快，在低维隐空间表现更佳。论文解读在人工智能的图像生成 ...

36氪

超越OpenAI，拿下全球双料第一，“AI吴彦祖”背后大模型SOTA了！

国产大模型突袭，AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02，同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一！而且还是榜单前十名中唯一的国产玩家。要知道，这俩榜首长期被OpenAI、ElevenLabs占据，前者不用多 ...

腾讯网

CVPR2025：华科开源VA-VAE+LightningDiT，DiT训练效率提升21倍

传统潜在扩散模型长期面临「重建」与「生成」的博弈：提升图像重建质量需增加特征维度，却导致生成性能断崖式下跌。传统视觉标记器（VAE）通过构建潜在空间，将图像映射到低维向量表示，从而实现对图像信息的压缩和编码。在后续的任务中，再利用这些 ...

新浪网

港科大开源VideoVAE+，视频重建质量全面超越最新模型

港科大团队重磅开源 VideoVAE+，提出了一种强大的跨模态的视频变分自编码器（Video VAE），通过提出新的时空分离的压缩机制和创新性引入文本指导，实现了对大幅运动视频的高效压缩与精准重建，同时保持很好的时间一致性和运动恢复。 VideoVAE + 模型大幅超过 ...

51CTO

港科大开源VideoVAE+，视频重建质量全面超越最新模型

VideoVAE 模型（Video Variational Autoencoder）是一种基于深度学习的生成模型，用于对视频数据进行压缩、重建和生成，讲视频从 RGB 像素空间投影到低维度的 latent 空间。港科大团队重磅开源 VideoVAE+，提出了一种强大的跨模态的视频变分自编码器（Video VAE），通过 ...

腾讯网

港科大开源VideoVAE+，视频重建质量全面超越最新模型

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com ...

搜狐

深入解析变分自编码器（VAE）：大型语言模型背后的秘密

在当前人工智能领域，变分自编码器（Variational Autoencoder, VAE）正成为一项不可忽视的技术，它以其独特的生成能力和高效的数据表示在许多应用中展示了强大的潜力。特别是在大型语言模型（LLM）的发展之中，VAE的角色显得尤为重要。本文将带您深入了解VAE的 ...

IT之家

全球首个类 Sora 开源复现方案来了！全面公开所有训练细节和模型权重

全球首个开源的类 Sora 架构视频生成模型，来了！整个训练流程，包括数据处理、所有训练细节和模型权重，全部开放。这就是刚刚发布的 Open-Sora 1.0。它带来的实际效果如下，能生成繁华都市夜景中的车水马龙。还能用航拍视角，展现悬崖海岸边，海水拍打着 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果