如何使用 Beautifulsoup 删除标签但保留其内容
有关如何使用 Beautifulsoup 删除标签但保留其内容的分步指南。
使用 Beautifulsoup 删除标签但保留其内容是一项非常简单的任务 - 对于每个标签对象,您可以使用 get_text() 方法。
重要提示:我们将在本教程中使用真实示例,因此您需要 要求 以及 美汤 已安装库。
步骤 1。 让我们首先导入 Beautifulsoup 库。
from bs4 import BeautifulSoup
步骤 2。 然后,导入请求库。
import requests
步骤 3。 获取目标登录页面的源代码。我们将在此示例中使用主页。
r=requests.get("https://proxyway.com/")
步骤 4。 将 HTML 代码转换为名为的 Beautifulsoup 对象 汤.
soup=BeautifulSoup(r.content,"html.parser")
第四步。现在,找到您想要接收内容的标签。在此示例中,我们将尝试获取标题标签的内容。
text_remove_tag=soup.find("title").get_text()
步骤 6。 让我们通过打印来检查我们的代码是否有效。
print(text_remove_tag)
结果:
恭喜,您已使用 Beautifulsoup 删除了一个标签,但保留了其内容。以下是完整脚本:
from bs4 import BeautifulSoup
import requests
r=requests.get("https://proxyway.com/")
soup=BeautifulSoup(r.content,"html.parser")
text_remove_tag=soup.find("title").get_text()
print(text_remove_tag)