OCR

Optical Character Recognition，光学字符识别，一种通过扫描后将文本转换为可编辑数字文本的技术。通过使用图像处理和机器学习等技术，OCR可以将印刷文本转换为计算机可读的数字文本，从而实现对文本的数字化处理和自动化识别。

分段

Segmentation，图像预处理的一个步骤，将文本块从整个图像中分离出来。

二值化

Binarization，将文本图像转换为只包含黑色和白色像素的图像。这种处理方法的优点是能够简化图像处理过程，提高处理效率。

切割

Snapping，将图像中的字符切割成单独的字符，方便后续的字符识别和处理。

识别率

Recognition rate，OCR系统正确识别字符的比率。识别率的计算公式为：（正确识别的字符数 / 总字符数） × 100%。识别率越高，说明OCR系统的性能越好，识别效果越准确。在实际应用中，识别率是评价OCR系统性能的重要标准之一，也是用户选择OCR系统的重要依据之一。

特征提取

Feature extraction，指从原始图像中提取出一些具有代表性的特征，这些特征可以用于描述图像的内容和结构。在文本图像识别中，特征提取是关键步骤之一，它可以帮助机器更好地理解和识别文本信息。

文本框检测

Text frame detection，在图像中识别和定位文本框的位置和大小的过程，可以帮助确定需要识别的文本区域，使OCR只检测感兴趣区域，从而减少OCR系统的计算量和误差。

字符序列

Character sequence，在OCR中，将多个字符组合在一起，以建立单词和句子的概念。

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

印刷文字识别

印刷文字识别

OCR

分段

二值化

切割

识别率

特征提取

文本框检测

字符序列

活动

息壤智算

应用商城

定价

合作伙伴

开发者

支持与服务

了解天翼云

印刷文字识别

印刷文字识别

OCR

分段

二值化

切割

识别率

特征提取

文本框检测

字符序列