0%

2020.3 | bug汇总#0

【日期】:2020/3/29

【问题】:pycharm无法import使用cmd下载的库

【如何修复】:打开 File ->Settings ->Project Interpreter ->点击齿轮按钮 ->add -> 在new enviroment的location中选择一个空文件夹,选中inherit global site-packages,OK。

【日期】:2020/3/30

【问题】:python爬取页面信息时,使用正则,无法找到<br>标签。

【原因】:在浏览器的分析工具中,显示的标签是<br>。但是在爬取的html文件中,标签是<br/>

【如何发现】:
使用
findCategory = re.compile(r'<p>.*?<br>') category = re.findall(findCategory, item)[0]
时,出现下标越界异常。print(acategory)发现结果是[],没有符合正则的字符串。

【如何修复】:将<br>替换为<br/>

【总结】:在对想要提取的内容写正则时,应当根据爬取的html写,而不是浏览器f12中的内容。

【日期】:2020/4/1

【问题】:Flask在接受post请求时,出现错误404。

【原因】:在地址栏输入地址时没有在末尾加“/”,一按回车自动在末尾添加添加“/”。而在接受表单的route方法中没有在末尾加“/”,导致访问的路径和可以接收的路径只差最后一个“/”。

【如何发现】:在提交表单时,观察路径,发现提交后路径多了一个“/”。

【如何修复】:@app.route('/test/result/', methods=["POST", "GET"]) 在接收路径最后加”/“。

【总结】:最好在所有路径结尾都加”/“。表单提交时和接收方法的路径不能相差一个“/”