【日期】:2020/3/29
【问题】:pycharm无法import使用cmd下载的库
【如何修复】:打开 File ->Settings ->Project Interpreter ->点击齿轮按钮 ->add -> 在new enviroment的location中选择一个空文件夹,选中inherit global site-packages,OK。
【日期】:2020/3/30
【问题】:python爬取页面信息时,使用正则,无法找到
<br>
标签。【原因】:在浏览器的分析工具中,显示的标签是
<br>
。但是在爬取的html文件中,标签是<br/>
。【如何发现】:
使用findCategory = re.compile(r'<p>.*?<br>') category = re.findall(findCategory, item)[0]
时,出现下标越界异常。print(acategory)发现结果是[],没有符合正则的字符串。【如何修复】:将
<br>
替换为<br/>
。【总结】:在对想要提取的内容写正则时,应当根据爬取的html写,而不是浏览器f12中的内容。
【日期】:2020/4/1
【问题】:Flask在接受post请求时,出现错误404。
【原因】:在地址栏输入地址时没有在末尾加“/”,一按回车自动在末尾添加添加“/”。而在接受表单的route方法中没有在末尾加“/”,导致访问的路径和可以接收的路径只差最后一个“/”。
【如何发现】:在提交表单时,观察路径,发现提交后路径多了一个“/”。
【如何修复】:
@app.route('/test/result/', methods=["POST", "GET"])
在接收路径最后加”/“。【总结】:最好在所有路径结尾都加”/“。表单提交时和接收方法的路径不能相差一个“/”