最近小菜鸟在使用Python爬虫的过程中遇到一些问题,我想爬取一些老师的简历,并提取其中的关键字文本,如姓名、职称。
在一个简历网址中匹配出来可以,但是如果想在多个简历网址中匹配出这些关键字应该怎么做呢。我爬取到了60个网址,在这些网址中的关键字位置不一定相同,请问怎样做到批量匹配?
还请各位前辈不吝赐教。
最近小菜鸟在使用Python爬虫的过程中遇到一些问题,我想爬取一些老师的简历,并提取其中的关键字文本,如姓名、职称。
在一个简历网址中匹配出来可以,但是如果想在多个简历网址中匹配出这些关键字应该怎么做呢。我爬取到了60个网址,在这些网址中的关键字位置不一定相同,请问怎样做到批量匹配?
还请各位前辈不吝赐教。
正则表达式要根据具体文本内容的格式来写,你发下具体文本内容的格式