Algorithm
- README

BigData
- README
- bigdata-Redis
- bigdata-clean
- bigdata-ecosphere
- bigdata-flink
- bigdata-hadoop
- bigdata-hbase
- bigdata-hive-sql
- bigdata-hive
- bigdata-huey
- bigdata-kafka
- bigdata-prestodb
- bigdata-quality-analysis
- bigdata-rabbitmq
- bigdata-scylladb
- bigdata-spark
- bigdata-visualization-web

Languages
- Go
  - go-env-config
  - go-info
  - readme
- Linux
  - README
  - linux-apache
  - linux-bashshell
  - linux-centos8
  - linux-cmdn-test
  - linux-cmdn-tools
  - linux-ftp
  - linux-function
  - linux-https-cert
  - linux-locale
  - linux-network
  - linux-nfs
  - linux-ntpd
  - linux-pip
  - linux-raid
  - linux-restart-scripts
  - linux-ssh
  - linux-svn
  - linux-term-info
  - linux-trash
  - linux-using-cmd
  - linux-virtualenvwarapper
  - linux-yum
  - 趣味命令
- Python
  - README
  - learn1-base-know
  - learn1-class
  - learn1-data-type
  - learn1-func
  - learn1-info
  - learn1-install
  - learn1-knowledge
  - learn1-module
  - learn1-runoob
  - learn1-try-except
  - learn2-asyc-code
  - learn2-base-principle
  - learn2-decorator
  - learn2-design-mode
  - learn2-garbage-collection
  - learn2-generators
  - learn2-magic-func
  - learn2-optimization-tips
  - learn2-optimization-tools
  - learn2-process
  - learn5-algorithm-know
  - learn5-algorithm-topic
  - learn5-data-structure
  - learn9-code-format
  - learn9-py2-diff-py3
  - learn9-py2-to-py3
  - learn9-scripts-read-conf
  - learn9-terms
  - learn9-utils
  - lib-logging
  - lib-os
  - lib-re
  - lib-sys
  - lib-time
  - lib3-click
  - lib3-dask
  - lib3-faker
  - lib3-flask
  - lib3-ipython
  - lib3-jieba
  - lib3-nosetests
  - lib3-pandas
  - lib3-re
  - lib3-selenium
  - lib3-sqlalchemy
  - lib3-z-packages
- Web
  - ReadMe
  - bootstrap
  - web-angularJs
  - web-echarts
  - web-gis
  - web-html
  - web-http-requests
  - web-javascripts

Projects
- GUI编程
  - GUI
  - 课堂抽签助手
    - config
    - database-4bcf258d288d59d13e33eafc4692e706
- README
- Stocks
  - 01-选股思路
  - README

README

TODO

Tools
- A-Tips
  - 001-术语知识
  - 002-知识清单
  - 01-IT术语
  - 03-数据结构
  - 04-算法
  - A-hot-github
  - B04-趣味算法题
  - datastruct-chain
  - datastruct-index
  - info
  - readme
  - tips-cmd
  - tips001
  - 策略知识
- Anaconda
  - cmd
  - config
  - install
  - issue
  - readme
- BigData
  - README
  - bigdata-Redis
  - bigdata-clean
  - bigdata-ecosphere
  - bigdata-flink
  - bigdata-hadoop
  - bigdata-hbase
  - bigdata-hive-sql
  - bigdata-hive
  - bigdata-huey
  - bigdata-kafka
  - bigdata-prestodb
  - bigdata-quality-analysis
  - bigdata-rabbitmq
  - bigdata-scylladb
  - bigdata-spark
  - bigdata-visualization-web
- Centos8
  - README
- Chrome
  - Win-Chrome
  - module
  - plugins
  - readme
- Crawl
  - README
  - crawl-anti-spider
  - crawl-auth
  - crawl-download-progress-bar
  - crawl-framework-diff
  - crawl-info
  - crawl-lawer
  - crawl-pyquery
  - crawl-re
  - crawl-resumable-large-files
  - crawl-xpath
- Databases
  - README
  - db-db2
  - db-mysql
  - db-oracle-config
  - db-oracle-optimization
  - db-oracle
- Django
  - README
  - cmd
  - config
  - example
  - function
  - install
  - plugins-edit
  - plugins
- Docker
  - docker-cdh
  - docker-cmd
  - docker-compose
  - docker-db2
  - docker-es
  - docker-function
  - docker-info
  - docker-install
  - docker-issue
  - docker-mysql
  - docker-neo4j
  - docker-oracle
  - docker-redis
  - readme
- ElasticSearch
  - README
  - es-cmd
  - es-config
  - es-function
  - es-install
  - es-issue
- Git
  - README
  - git
- Github
  - github
  - plugins
  - readme
- Graph
  - gremlin-cmd
  - hugegraph-cmd
  - hugegraph-info
  - hugegraph-install
  - hugegraph-issue
  - hugegraph-load
  - neo4j-cmd
  - neo4j-config
  - neo4j-function
  - neo4j-info
  - neo4j-install
  - neo4j-load
  - readme
- Hexo
  - hexo
- NodeJs
  - cmd
  - install
- Pycharm
  - README
  - Win-Pycharm
  - crack
- README
- Server
  - CentOS8
  - README
  - Win10
- Tips
  - README
  - Win-VNC
  - Win-Virtualbox
  - code-line-statis
  - drools-rule-engine
  - gitbook
  - sbt
- Vscode
  - Win-VScode
  - plugins
  - readme
- ml
  - README
  - docs
    - ml-01学习指南
    - ml-02相关术语
    - ml-03发展历程
    - ml-04代码实践
  - google-course
    - 01快速链接
    - 02机器学习概念
    - 03机器学习工程
    - 04机器学习系统在现实世界里的应用
    - readme

resources

Xpath

fansichao 2021-10-23 16:25:17

Categories： Tags：

from lxml import etree

web_data="xxxx<div>xxx</div>"
html = etree.HTML(web_data)

# 打印html
result = etree.tostring(html, pretty_print=True).deocde('utf-8')

路径表达式说明
- nodename 选取此节点的所有子节点。
- / 绝对路径 从根节点选取。
- // 相对路径 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
- . 选取当前节点。
- .. 选取当前节点的父节点。
- @ 选取属性。

# 样例
/html/body/div/ul/li/a/text()
# 获取a标签的href属性
//ul/li/a/@href
# 获取a标签属性href=xxx.html的内容
//ul/li/a[@href="xxx.html"/text()]
# 查询倒数第二个li中的内容
//li[last()-1]/a/text()

参考链接:

大文件断点续传功能