几篇开创性论文极大地塑造了计算机视觉领域。其中最有影响力的是John Canny (1986) 的 “边缘检测的计算方法”,它介绍了Canny边缘检测器,这是一种检测图像边缘的关键方法。本文为后续的许多边缘检测算法奠定了基础。另一篇重要的论文是David Lowe (1999) 的 “从局部尺度不变特征识别对象”,该论文介绍了SIFT (尺度不变特征变换) 算法。SIFT广泛用于对象识别中的特征提取,特别是在尺度和旋转变化显著的任务中。深度学习时代的一篇基础论文是Olga Russakovsky等人 (2015) 的 “ImageNet大规模视觉识别挑战”,其中详细介绍了ImageNet数据集和用于图像分类的深度学习方法。本文证明了卷积神经网络 (cnn) 在大规模图像分类任务中的有效性。另一篇关键论文是Ross B. Girshick (2015) 的 “Fast r-cnn”,该论文通过将区域提议网络与CNN集成在一起来改进对象检测。除其他外,这些工作继续影响着现代计算机视觉技术。
计算机视觉的下一步移动应用是什么?

继续阅读
自然语言处理(NLP)在语音合成和语音识别中的应用是怎样的?
词性 (POS) 标记通过为名词,动词,形容词或副词等词分配标签,在理解句子的语法结构中起着至关重要的作用。例如,在句子 “the cat sleeps” 中,POS标记将 “The” 标识为确定器,将 “cat” 标识为名词,并将 “sl
BLOOM模型是如何支持多语言任务的?
训练LLM需要能够处理大规模计算的高性能硬件。Gpu (图形处理单元) 和tpu (张量处理单元) 是常用的,因为它们能够并行处理多个任务。这些设备对于矩阵运算的有效执行至关重要,矩阵运算构成了神经网络计算的支柱。
像NVIDIA A10
关系数据库是如何处理全文搜索的?
关系数据库使用专门的索引技术来处理全文搜索,这些技术允许更快、更高效地搜索文本数据。与传统的基于相等性的精确匹配搜索不同,全文搜索分析文本字段的内容,并允许基于关键词、短语甚至单词出现的上下文进行搜索。这是通过使用全文索引来实现的,全文索引



