1 Star 0 Fork 8

chenp / blog

forked from 1264644959 / blog 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
python去除字符串中两个字符中间的所有.md 1.16 KB
一键复制 编辑 原始数据 按行查看 历史
1264644959 提交于 2020-09-18 13:08 . commit

需求

对企业名称进行字段清洗

山东小米科技有限责任(济宁)公司

由于后期需要进行字段匹配,模糊搜索

将其清洗为 山东小米科技有限责任公司

def chuli(tup):

    if not tup:
        return
    baseid = tup[0]
    basename = tup[1]
    #未清洗之前的企业名称
    basename_copy = tup[1]
    if "(" in basename:
        basename = basename.replace('(','(')
    if ")" in basename:
        basename = basename.replace(')',')')

    if "(" in basename:
        s_index = basename.index("(")
        e_index = basename.index(")")
        rm_str = basename[s_index:e_index+1]
        basename = basename.replace(rm_str,"")


    basename = re.sub("[A-Za-z0-9\!\%\[\]\,\,\.\。\n\、\\\\;]", "", basename)

参数tup来自于

try:
    cursor.execute(sql)
    row = cursor.fetchone()
    print(row)
    chuli(row)
    print("__________________________")
    while row:
        select_num += 1
        row = cursor.fetchone()
        print(row)
        chuli(row)
except Exception as e:
    print(e)

无题

君生我未生,我生君已老。

君恨我生迟,我恨君生早。

马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/nchenp/blog.git
git@gitee.com:nchenp/blog.git
nchenp
blog
blog
master

搜索帮助

344bd9b3 5694891 D2dac590 5694891