目录


1 Photo OCR

照片OCR

2 作业

本节课无作业。

3 总结

照片OCR可以用于图片搜索:输入文本,输出相应图片。这个例子展现了实际Machine Learning问题的复杂性。通过将任务分解可以将复杂问题转换成相对简单的子问题,比如照片OCR可以分解成文本检测文本分割文本识别等三个问题。实现好三个子问题就自动实现好整个问题。在实际时间分配中,通过天花板分析(用正确输入替代某个pipline部分)可以获得该pipeline部分若正确可以提高准确率的百分比,从而根据百分比的大小安排时间来最有效的提高最终准确度。

4 参考资料


Share Post

Twitter Google+

Shunmian

The only programmers in a position to see all the differences in power between the various languages are those who understand the most powerful one.