之前解析字符串都是上正则,导致后来解析HTML/XML也习惯上正则,可是毕竟正则太底层的东西,对于这种有规律的文档,它不是一个好的选择。
后来发现了HTMLParser,感觉比正则好多了,正想深入学习一下,却发现了这个。
一比较然后我把以前代码里面的解析HTML/XML的正则全删了,改成BS来解析,所以在此推荐这个HTML/XML文档解析模块,当然它也可以用来修改文档。
至于示例和详细说明便不说了,文档写得不错,而且还是中文的。
时间: 2024-12-05 18:56:35
之前解析字符串都是上正则,导致后来解析HTML/XML也习惯上正则,可是毕竟正则太底层的东西,对于这种有规律的文档,它不是一个好的选择。
后来发现了HTMLParser,感觉比正则好多了,正想深入学习一下,却发现了这个。
一比较然后我把以前代码里面的解析HTML/XML的正则全删了,改成BS来解析,所以在此推荐这个HTML/XML文档解析模块,当然它也可以用来修改文档。
至于示例和详细说明便不说了,文档写得不错,而且还是中文的。