优秀论文分享

  • Deep Residual Learning for Image Recognition
    被引次数: 293166推荐理由: 提出ResNet(残差网络),解决了极深网络难以训练的问题,使得构建数百甚至上千层的网络成为可能查看原文
  • Adam: A method for stochastic optimization
    被引次数: 229558推荐理由: 深度学习领域最常用、最著名的优化算法,是目前训练神经网络时的默认优化器查看原文
  • Attention Is All You Need
    被引次数: 203326推荐理由: Transformer架构的开山之作。它提出的自注意力机制是当今所有LLM的核心基础,是NLP乃至AI领域最重要的论文之一查看原文
  • Very Deep Convolutional Networks for Large-Scale Image Recognition
    被引次数: 152808推荐理由: 提出 VGGNet,其简洁的堆叠3x3卷积的结构影响了后续很多网络设计,至今仍被广泛用于特征提取查看原文
  • Imagenet classification with deep convolutional neural networks
    被引次数: 149388推荐理由: 提出 AlexNet,在ImageNet竞赛中以远超第二名的成绩震惊学界,标志着深度学习在图像识别上的突破查看原文
  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
    被引次数: 149030推荐理由: 提出BERT模型,开启NLP的"预训练-微调"范式,几乎所有后续语言模型都源自 BERT 框架查看原文
  • Scikit‑learn: Machine Learning in Python
    被引次数: 121795推荐理由: 机器学习领域最重要的一个Python工具包,所有做机器学习的人都会用到查看原文
  • Deep Learning
    被引次数: 104285推荐理由: 深度学习领域的标志性综述,由AI学术"三巨头"合著,极大推动了深度学习的热潮和普及查看原文
  • ImageNet: A Large-Scale Hierarchical Image Database
    被引次数: 91356推荐理由: 提出了 ImageNet数据集,为计算机视觉领域提供了重要的数据和统一的 benchmark,对该领域推动作用很大查看原文
  • Generative Adversarial Nets
    被引次数: 87138推荐理由: 提出 GAN,开创性的生成式模型框架查看原文
  • Going Deeper with Convolutions
    被引次数: 70019推荐理由: 提出了GoogLeNet模型与Inception,实现了在保持计算效率的同时显著增加网络深度和宽度查看原文
  • Pytorch: An imperative style, high-performance deep learning library
    被引次数: 64812推荐理由: 介绍了深度学习框架Pytorch,目前是工业界和学术界最主流的深度学习框架查看原文
  • Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
    被引次数: 63623推荐理由: 提出Batch Normalization技术,极大地改善了深度网络的训练速度、稳定性和性能,是深度学习工程实践中的一项核心技术查看原文
  • Dropout: a simple way to prevent neural networks from overfitting
    被引次数: 59758推荐理由: 提出Dropout,防止过拟合最常用的技术之一查看原文
  • Language Models are Few-Shot Learners
    被引次数: 58162推荐理由: GPT-3论文,展示了超大规模模型的"上下文学习"能力查看原文
  • Faster r-cnn: Towards real-time object detection with region proposal networks
    被引次数: 56777推荐理由: 提出 RPN,大幅提升了目标检测算法的速度,实现了接近实时的性能,是两阶段目标检测算法的里程碑查看原文
  • Efficient estimation of word representations in vector space
    被引次数: 50427推荐理由: 提出了著名的Word2Vec模型,是NLP迈向深度学习时代的关键基石之一查看原文
  • Human-level control through deep reinforcement learning
    被引次数: 38396推荐理由: 提出DQN,深度强化学习的奠基之作查看原文
  • Proximal Policy Optimization Algorithms
    被引次数: 31989推荐理由: 提出 PPO,强化学习主流策略优化算法之一查看原文
  • TensorFlow: A System for Large-Scale Machine Learning
    被引次数: 29465推荐理由: 介绍了谷歌开源的深度学习框架TensorFlow,是工业界和学术界最主流的深度学习平台之一查看原文