欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

python实现验证码识别功能

程序员文章站 2023-09-01 15:38:23
本文实例为大家分享了python实现验证码识别的具体代码,供大家参考,具体内容如下 1.通过二值化处理去掉干扰线 2.对黑白图片进行降噪,去掉那些单独的黑色像素点 3...

本文实例为大家分享了python实现验证码识别的具体代码,供大家参考,具体内容如下

1.通过二值化处理去掉干扰线

2.对黑白图片进行降噪,去掉那些单独的黑色像素点

3.消除边框上附着的黑色像素点

4.识别图像中的文字,去掉空格与'.'

python代码:

from pil import image 
from aip import aipocr 
 
file='1-1-7' 
 
# 二值化处理,转化为黑白图片 
def two_value(): 
 for i in range(1, 5): 
  # 打开文件夹中的图片 
  image = image.open(file+'.jpg') 
  # 灰度图 
  lim = image.convert('l') 
  # 灰度阈值设为165,低于这个值的点全部填白色 
  threshold = 165 
  table = [] 
 
  for j in range(256): 
   if j < threshold: 
    table.append(0) 
   else: 
    table.append(1) 
 
  bim = lim.point(table, '1') 
  bim.save(file+'.1.jpg') 
 
two_value() 
 
# 去除干扰线 
im = image.open(file+'.1.jpg') 
# 图像二值化 
data = im.getdata() 
w, h = im.size 
black_point = 0 
 
for x in range(1, w - 1): 
 for y in range(1, h - 1): 
  mid_pixel = data[w * y + x] # *像素点像素值 
  if mid_pixel < 50: # 找出上下左右四个方向像素点像素值 
   top_pixel = data[w * (y - 1) + x] 
   left_pixel = data[w * y + (x - 1)] 
   down_pixel = data[w * (y + 1) + x] 
   right_pixel = data[w * y + (x + 1)] 
 
   # 判断上下左右的黑色像素点总个数 
   if top_pixel < 5: #小于5比小于10更精确 
    black_point += 1 
   if left_pixel < 5: 
    black_point += 1 
   if down_pixel < 5: 
    black_point += 1 
   if right_pixel < 5: 
    black_point += 1 
   if black_point < 1: 
    im.putpixel((x, y), 255) 
    # print(black_point) 
   black_point = 0 
 
im.save(file+'.2.jpg') 
 
# 去除干扰线 
im = image.open(file+'.2.jpg') 
# 图像二值化 
data = im.getdata() 
w, h = im.size 
black_point = 0 
 
for x in range(1, w - 1): 
 for y in range(1, h - 1): 
  if x < 2 or y < 2: 
   im.putpixel((x - 1, y - 1), 255) 
  if x > w - 3 or y > h - 3: 
   im.putpixel((x + 1, y + 1), 255) 
 
im.save(file+'.3.jpg') 
 
# 定义常量 
app_id = '11352343' 
api_key = 'nd5z1nkgoldvhwbnd2bflpce' 
secret_key = 'a9fsnnpj1ys2gof70sngyo23hkoik8os' 
 
# 初始化aipface对象 
aipocr = aipocr(app_id, api_key, secret_key) 
 
# 读取图片 
filepath=file+'.3.jpg' 
def get_file_content(filepath): 
 with open(filepath, 'rb') as fp: 
  return fp.read() 
 
# 定义参数变量 
options = { 
 'detect_direction': 'true', 
 'language_type': 'chn_eng', 
} 
 
# 调用通用文字识别接口 
result = aipocr.basicgeneral(get_file_content(filepath), options) 
print(result) 
words_result=result['words_result'] 
for i in range(len(words_result)): 
 print(words_result[i]['words'].replace(' ','').replace('.','')) #去掉可能被识别的空格与. 

python实现验证码识别功能

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。