[爬蟲實戰] 如何破解高鐵驗證碼 (2) - 使用迴歸方法去除多餘弧線?

  • 大數學堂
  • 2017年11月1日 14:35

在去除掉腦人的噪音點後,如何該去除掉跟字一樣粗的弧線便是大問題。

所幸,所有高鐵驗證碼的弧線都可以簡單的用一個二項式迴歸公式表示,因此我們便可以用sklearn 的linear model去適配出迴歸線後,便可以擦去這條煩人的弧線,提高圖片的可辨識率!

程式碼: https://github.com/ywchiu/largitdata/blob/master/code/Course_97.ipynb