www.flydean.com
  • README
  • blog
    • 新版博客回归啦
    • projects
      • 一键自动化博客发布工具,用过的人都说好(简书篇)
      • 一键自动化博客发布工具,chrome和firfox详细配置
      • 一键自动化博客发布工具,用过的人都说好(segmentfault篇)
      • 一键自动化博客发布工具,用过的人都说好(oschina篇)
      • 一键自动化博客发布工具,用过的人都说好(阿里云篇)
      • 一键自动化博客发布工具,用过的人都说好(cnblogs篇)
      • 一键自动化博客发布工具,用过的人都说好(infoq篇)
      • 一键自动化博客发布工具,用过的人都说好(csdn篇)
      • 一键自动化博客发布工具,用过的人都说好(51cto篇)
      • 一键自动化博客发布工具,用过的人都说好(掘金篇)
      • 一键自动化博客发布工具,用过的人都说好(腾讯云篇)
      • 一键自动化博客发布工具,用过的人都说好(头条篇)
      • 一键自动化博客发布工具,用过的人都说好(知乎篇)
      • 一键自动化博客发布工具,用过的人都说好(公众号篇)
      • moneyPrinterPlus
        • MoneyPrinterPlus:AI自动短视频生成工具,赚钱从来没有这么容易过
        • MoneyPrinterPlus:AI自动短视频生成工具,详细使用教程
        • MoneyPrinterPlus:AI自动短视频生成工具-阿里云配置详解
        • MoneyPrinterPlus:AI自动短视频生成工具-腾讯云配置详解
        • MoneyPrinterPlus:AI自动短视频生成工具-微软云配置详解
        • 重磅!免费一键批量混剪工具它来了,一天上万短视频不是梦
        • 福利来了!MoneyPrinterPlus可以自动配置环境和自动运行了
        • 重磅来袭!MoneyPrinterPlus一键发布短视频到视频号,抖音,快手,小红书上线了
        • MoneyPrinterPlus全面支持本地Ollama大模型
        • 在MoneyPrinterPlus中使用本地chatTTS语音模型
        • fasterWhisper和MoneyPrinterPlus无缝集成
        • 再升级!MoneyPrinterPlus集成GPT_SoVITS
    • tools
      • 来了,永久免费的图床服务
      • 给picgo上传的图片加个水印
      • 手动给docusaurus添加一个搜索
  • docs
    • blockchain
      • 00-blockchain
      • 01-bitcoin
        • 01-bitcoin-overview
        • 02-bitcoin-blockchain-network
        • 03-bitcoin-consensus
        • 04-bitcoin-transactions
        • 05-bitcoin-mine-consensus
        • 06-bitcoin-in-trouble
      • 03-hyperledger
        • 01-Introduction-to-distributed-ledgers
        • 02-hyperledger-fabric-basics
        • 03-technical-advantages-fabric
        • 04-blockchain-vscode-extension
        • 05-use-vs-connect-ibc
        • 06-run-Fabric-on-ibm-Cloud
      • 04-libra
        • 01-libra-white-paper-interpretation
        • 2. Libra教程之:数据结构和存储
        • 3. Libra教程之:执行Transactions
        • 4. Libra教程之:move语言的特点和例子
        • 5. Libra教程之:Libra协议的关键概念
        • 6. Libra protocol的逻辑数据模型
        • 7. Transaction的生命周期
        • 8. 来了,你最爱的Move语言
        • 9. 运行自定义move modules
        • 10. Libra testnet使用指南
      • 02-ethereum
        • Solidity
          • 1. Solidity的Bytecode和Opcode简介
    • cryptology
      • 01-consistency-hash
      • 02-sybil-attack
      • 03-tor
      • 04-hmac
      • 05-erc20-short-address-attack
      • 06-mac-attack
      • 07-one-time-password
      • 8. DES
      • 9. AES
      • 10. 分组密码与模式
      • 11. 私钥公钥系统
      • 12-RSA算法
      • 13. 什么是中间人攻击
      • 14-混合密码系统
      • 15-单向散列函数
      • 16. 数字签名
      • 17. 一文读懂密码学中的证书
      • 18. 密钥详解
      • 19. 更加安全的密钥生成方法Diffie-Hellman
      • 20. 基于口令的密码(PBE)
      • 21. 一篇文章让你彻底弄懂SSL/TLS协议
      • 22-known-plaintext-attack
      • 23-Content-sniffing
      • 24-csrf
      • 25-SHA1-2-3
      • 26-IDEA
      • 27-memory-hard
      • 27-memory-hard_zhihu
      • 28-safer
      • 29-collision-attack
      • 30-birthday-attack
      • 30 Side Channel Attack
      • 31-feistel-cipher
      • 32-blowfish
      • 33-twofish
      • 34 Memory Bound
      • 35-MD-length-extension
      • 36 Sponge Function
      • 37 Bcrypt
      • 38-Argon2
      • 39-Pbkdf2
      • 40-scrypt
      • 41-CORS
      • 42-pki-x509
      • 43-pki-ocsp
      • 44-openssl-ocsp
      • 45-openssl-private-ca
      • 46-ASN.1
      • 47-x690-ber-cer-der
      • 48-PEM-PKCS7812
    • db
      • 01-IndexedDB-kickoff
    • java
      • java程序员从小工到专家成神之路(2024版)
      • 1-java-base
        • 前言
        • 01-string-all-in-one
        • 02-java-string-encodings
        • 03-base-shallow-copy-deep-copy
        • 04-do-you-know-class-name
        • 05-duration-period-ChronoUnit
        • 06-inner-class-inner-interface
        • 07-java-serialization
        • 8. 什么?注释里面的代码居然能够执行
        • 9. Java函数式编程和Lambda表达式
        • 10-lambda-closure
        • 11-type-inference-lambda
        • 12-marker-interface-annotation-processor
        • 13-java-jar-in-detail
        • 14-java-spi-for-extensible-app
        • 15-wordcount-in-one-line
        • 16-how-to-stop-thread
        • 17-why-use-peek
        • 18-checked-exception-in-lambda
      • 2-io-nio
        • 简介
        • 01-io-nio-overview
        • 02-io-file
        • 03-io-try-with
        • 4. 小师妹学JavaIO之:文件读取那些事
        • 5. 小师妹学JavaIO之:文件写入那些事
        • 6. 小师妹学JavaIO之:目录还是文件
        • 7. 小师妹学JavaIO之:文件系统和WatchService
        • 8. 小师妹学JavaIO之:文件File和路径Path
        • 9. 小师妹学JavaIO之:Buffer和Buff
        • 10. 小师妹学JavaIO之:File copy和File filter
        • 11. 小师妹学JavaIO之:NIO中Channel的妙用
        • 12. 小师妹学JavaIO之:MappedByteBuffer多大的文件我都装得下
        • 13. 小师妹学JavaIO之:NIO中那些奇怪的Buffer
        • 14. 小师妹学JavaIO之:用Selector来说再见
        • 15. 小师妹学JavaIO之:文件编码和字符集Unicode
      • 3-concurrent
        • 简介
        • 1. java.util.concurrent简介
        • 2. java并发中的Synchronized关键词
        • 3. java中的Volatile关键字使用
        • 4. java中wait和sleep的区别
        • 5. java中Future的使用
        • 6. java并发中ExecutorService的使用
        • 7. java中Runnable和Callable的区别
        • 8. java中ThreadLocal的使用
        • 9. java中线程的生命周期
        • 10. java中join的使用
        • 11. 怎么在java中关闭一个thread
        • 12. java中的Atomic类
        • 13. java中interrupt,interrupted和isInterrupted的区别
        • 14. java中的daemon thread
        • 15. java中ThreadPool的介绍和使用
        • 16. java 中的fork join框架
        • 17. java并发中CountDownLatch的使用
        • 18. java中CyclicBarrier的使用
        • 19. 在java中使用JMH(Java Microbenchmark Harness)做性能测试
        • 20. java中ThreadLocalRandom的使用
        • 21. java中FutureTask的使用
        • 22. java中CompletableFuture的使用
        • 23. java中使用Semaphore构建阻塞对象池
        • 24. 在java中构建高效的结果缓存
        • 25. java中CompletionService的使用
        • 26. 使用ExecutorService来停止线程服务
        • 27. 我们的线程被饿死了
        • 28. java中有界队列的饱和策略(reject policy)
        • 29. 由于不当的执行顺序导致的死锁
        • 30. 非阻塞同步机制和CAS
        • 31. 非阻塞算法(Lock-Free)的实现
        • 32. java内存模型(JMM)和happens-before
        • 33. java多线程之Phaser
        • 34. java中Locks的使用
        • 35. ABA问题的本质及其解决办法
        • 36. 并发和Read-copy update(RCU)
        • 37. 同步类的基础AbstractQueuedSynchronizer(AQS)
        • 38. java并发Exchanger的使用
      • 4-stream
        • 简介
        • 00001-java-8-streams-Introduction
        • 00002-functional-interface
        • 00003-lambda-best-practices
        • 00004-java-8-stream-ifelse
        • 00005-java-8-stream-map
        • 00006-java-rethrow
        • 00007-java-Collectors
        • 00008-java-8-stream-reduce
        • 00009-java-8-Spliterator
        • 00010-java-8-stream-foreach-break
        • 00011-java-8-predicate-chain
        • 00012-java-8-infinite-stream
        • 00013-java-8-stream-cust-pool
        • 00014-java-8-stream-peek
        • 00015-java-custom-collector
        • 00016-java-8-lambda-exception
      • 5-collections
        • 前言
        • 01-asList-arraylist
        • 02-Comparable-Comparator
        • 03-enumMap-enumSet
        • 04-Generics-in-deep
        • 05-hashMap-LinkedHashMap
        • 06-HashMap-TreeMap
        • 07-how-to-copy-list
        • 08-iterator-to-list
        • 09-java-fail-safe-fail-fast
        • 10-queue-overview
        • 11-PriorityQueue
        • 12-SynchronousQueue
        • 13-type-erase
        • 14-reference-referenceType
        • 15-skiplist-ConcurrentSkipListMap
        • 16-DelayQueue
      • 6-jvm
        • 00-java-jvm-all-in-one
        • 1. 小师妹学JVM之:JVM的架构和执行过程
        • 2. 终于我用JOL打破了你对java对象的所有想象
        • 3. 小师妹学JVM之:java的字节码byte code简介
        • 4. 小师妹学JVM之:Dirty cards和PLAB
        • 5. 小师妹学JVM之:JVM中栈的frames详解
        • 6. 如果你想写自己的Benchmark框架
        • 7. JVM详解之:java class文件的密码本
        • 8. JVM系列之:String,数组和集合类的内存占用大小
        • 9. JVM系列之:Contend注解和false-sharing
        • 10. JVM系列之:对象的锁状态和同步
        • 11. JVM系列之:String.intern和stringTable
        • 12. JVM系列之:String.intern的性能
        • 13. JVM详解之:本地变量的生命周期
        • 14. JVM详解之:HotSpot VM中的Intrinsic methods
        • 15. JVM系列之:通过一个例子分析JIT的汇编代码
        • 16. JVM详解之:类的加载链接和初始化
        • 17. 小师妹学JVM之:逃逸分析和TLAB
        • 18. JVM系列之:JIT中的Virtual Call
        • 19. JVM系列之:JIT中的Virtual Call接口
        • 20. JVM详解之:运行时常量池
        • 21. 小师妹学JVM之:JDK14中JVM的性能优化
        • 22. JVM系列之:从汇编角度分析Volatile
        • 23. JVM系列之:从汇编角度分析NullCheck
        • 24. 小师妹学JVM之:GC的垃圾回收算法
        • 25. 小师妹学JVM之:JVM中的Safepoints
        • 26. JVM系列之:再谈java中的safepoint
        • 27. troubleshoot之:用control+break解决线程死锁问题
        • 28. troubleshoot之:使用JFR解决内存泄露
        • 29. troubleshoot之:分析OutOfMemoryError异常
        • 30. troubleshoot之:使用JFR分析性能问题
        • 31. troubleshoot之:GC调优到底是什么
        • 32. JVM系列之:详解java object对象在heap中的结构
        • 33. 小师妹学JVM之:深入理解JIT和编译优化-你看不懂系列
        • 34. 小师妹学JVM之:JIT中的LogCompilation
        • 35. 小师妹学JVM之:JIT中的PrintCompilation
        • 36. 小师妹学JVM之:JIT中的PrintAssembly
        • 37. 小师妹学JVM之:JIT中的PrintAssembly续集
        • 38. 小师妹学JVM之:深入理解编译优化之循环展开和粗化锁
        • 39. 小师妹学JVM之:JIT的Profile神器JITWatch
        • 40. 小师妹学JVM之:cache line对代码性能的影响
      • 7-security
        • 00001-java-security-code-line-DOS
        • 00002-java-security-code-line-base
        • 00003-java-security-code-line-object
        • 00004-java-security-code-line-DLC
        • 00005-java-security-code-line-expresion
        • 00006-java-security-code-line-number
        • 00007-java-security-code-line-string
        • 00008-java-security-code-line-heap-pollution
        • 00009-java-security-code-line-object-copy
        • 00010-java-security-code-line-injection
        • 00011-java-security-code-line-input
        • 00012-java-security-code-line-mutability
        • 00013-java-security-code-line-method
        • 00014-java-security-code-line-exception
        • 00015-java-security-code-line-visibility-atomicity
        • 00016-java-security-code-line-lock
        • 00017-java-security-code-line-dead-lock
        • 00018-java-security-code-line-double-check-lock
        • 00019-java-security-code-line-thread
        • 00020-java-security-code-line-threadsafe
        • 00021-java-security-code-line-file-io
        • 00022-java-security-code-line-file-security
        • 00023-java-security-code-line-serialization
        • 00024-java-security-code-line-threadpool
      • 8-new-feature
        • 00-java-new-feature-all-in-one
        • 1. JDK11的重要新特性
        • 2. JDK12的五大重要新特性
        • 3. JDK13的六大重要新特性
        • 04-JDK9-java-module
        • 05-JDK9-String-Compact
        • 06-JDK9-jvm-xlog
        • 07-JDK10-var-usage
        • 08-JDK10-var-genericity-multiple-implements
        • 09-JDK10-var-anonymous-class
        • 10-JDK11-http-reactive
        • 11-JDK11-http-new
        • 12-JDK12-collectors-teeing
        • 13-JDK12-CompactNumberFormat
        • 14-JDK13-appCDS
        • 15. 一览为快,JDK14的新特性
        • 16. JDK 14的新特性:更加好用的NullPointerExceptions
        • 17-JDK14-records
        • 18-JDK14-text-block
        • 19-JDK14-switch
        • 20-JDK14-java-tools
        • 21-JDK14-jcmd
        • 22. JDK14的新特性:instanceof模式匹配
        • 23-JDK14-jfr-jmc-event-stream
        • 24-JDK15-new-features
        • 25-JDK15-release-new-features
        • 26-JDK16-new-features
        • 27-JDK17-new-features
      • 9-advanced-feature
        • 01-Java-Thread-Affinity
        • jna
          • 01-jni-overview
          • 02-jna-overview
          • 03-jna-Library-Mapping
          • 04-jna-type-mapping
          • 05-jna-type-mapping-details
          • 06-jna-memory
          • 07-jna-function
          • 08-jna-structure
          • 09-jna-callbacks
      • netty
        • 01 Netty Startup
        • 02 Netty Bytebuf
        • 03 Netty Architecture
        • 03-netty-bootstrap-ServerBootstrap
        • 04 Netty Channel
        • 04-netty-ChannelHandlerContext
        • 04-netty-ChannelPipeline
        • 04-netty-channel-group
        • 04-netty-channel-types
        • 04-netty-channel-vs-serverChannel
        • 04-netty-socketaddress
        • 05 Netty Channel Event
        • 05-netty-EventExecutor-EventExecutorGroup
        • 05-netty-eventloop-eventloopgroup
        • 05-netty-nioeventloop
        • 06 Netty Cheerup China
        • 07 Netty Stream Based Transport
        • 08 Netty Pojo Buf
        • 09 Netty Reconnect
        • 10 Netty Chat
        • 11 Netty Udp
        • 12 Netty Securechat
        • 13 Netty Customprotocol
        • 14-java-base64
        • 14-netty-ReplayingDecoder
        • 14-netty-codec-base64
        • 14-netty-codec-bytes
        • 14-netty-codec-json
        • 14-netty-codec-msg-to-bytebuf
        • 14-netty-codec-msg-to-msg
        • 14-netty-codec-object
        • 14-netty-codec-string
        • 14-netty-codec-xml
        • 14 Netty Cust Codec
        • 14-netty-frame-decoder
        • 15 Netty Buildin Frame Detection
        • 16 Netty Buildin Codec Common
        • 17-jboss-marshalling
        • 17-netty-marshalling
        • 17-netty-protobuf-UDP
        • 17 Netty Protobuf
        • 18 Netty Http Request
        • 19 Netty Http Client Request
        • 20 Netty Fileserver
        • 21 Netty Http Fileupload
        • 22 Netty Cors
        • 23 Netty Websocket Server
        • 24 Netty Websocket Server 2
        • 25 Netty Websocket Client
        • 26 Netty Secure Http 2
        • 27 Netty Http 2
        • 28 Netty Wrap Http 2
        • 29 Netty Flowcontrol
        • 30 Netty Http 2 Client
        • 31 Netty Framecodec Http 2
        • 32 Netty Http 2 Client Framecodec
        • 33 Netty Multiplex Http 2 Server
        • 34 Netty Multiple Server
        • 35 Netty Simple Proxy
        • 36 Netty Socks Support
        • 37 Netty Cust Socks Server
        • 38-netty-cust-port-unification
        • 39-netty-SelectorProvider-channelFactory
        • 40-netty-udt-support
        • 41-netty-udt-byte-message
        • 42-netty-rendezvous
        • 43-netty-reference-cound
        • 44-netty-tcp-fast-open
        • 45-netty-ByteBuf-ByteBuffer
        • 46-netty-future-executor
        • 47-netty-Thread-local-object-pool
        • 48-netty-fastThreadLocal
        • 49-netty-extensible-enum
        • 50-netty-Hashed-wheel-timer
        • 51-netty-Thread-Affinity
        • 52-netty-native-transport
        • 53-1-netty-kqueue-transport
        • 53-2-netty-epoll-transport
        • 54-netty-dns-over-tcp
        • 55-netty-dns-over-udp
        • 56-netty-dns-over-tls
        • 57-netty-dns-tcpserver
        • 58-netty-haproxy
      • 10-ORM
        • mybatis
          • 01-difference-between-#-and-$
    • reactive
      • reactive system初探
      • 02-reactive-stream
      • r2dbc
        • 01-r2dbc-introduce
        • 02-r2dbc-h2-in-depth
        • 03-r2dbc-mysql-in-depth
        • 04-spring-data-r2dbc
      • reactor
        • 01-introduction-to-reactor
        • 02-reactor-core-in-depth
        • 03-reactor-handle-errors
        • 04-reactor-thread-schedulers
    • scala
      • 00001 Scala Oo
      • 00002 Scala Base
      • 00003 Scala Functional
      • 00004 Scala Statically Typed
      • 5. 可扩展的scala
      • 00006 Scala Parameter
      • 00007 Scala Option Some Null
      • 00008 Scala Enumerations
      • 00009 Scala Partial Function
      • 00010 Scala Futures Promise
      • 00011 Scala Mutable Immutable Collection
      • 00012 Scala Either
      • 00013 Scala Covariance Contravariant
      • 00014 Scala Visibility
      • 00015 Scala Self Type
      • 00016 Scala Existential Type
      • 00017 Scala Higher Kinded
    • web-tech
      • 01-storage-api-limit
      • 02-web-storage-api
      • 03-webworker-kickoff
    • AI
      • 02-math
        • 01-singular-value
        • 02-probability-god-mod
        • 03-Turing-machine
        • 04-p-np-npc-problem
      • 03-machine-learning
        • 01-machine-learning-overview
      • 01-llma
        • langchain
          • 001-langchain-overview
          • 002-langchain-Prompts
          • 003-langchain-custprompts
          • 004-langchain-cust-example-selector
          • 005-langchain-llm
          • 006-langchain-chatmod
          • 007-langchain-output-parthcer
          • 008-langchain-retrieval-overview
          • 009-langchain-retrieval-document-loaders
    • AIGC
      • stable-diffusion
        • Stable diffusion 初学者指南
        • 构建一个优秀的Prompt
        • 轻松复现一张AI图片
        • Stable Diffusion中的常用术语解析
        • Stable diffusion中这些重要的参数你一定要会用
        • Stable Diffusion中的embedding
        • Stable diffusion中的models
        • Stable Diffusion WebUI详细使用指南
        • Stable diffusion采样器详解
        • 原来Stable Diffusion是这样工作的
        • hypernetwork在SD中是怎么工作的
        • SD中的VAE,你不能不懂
        • 手把手教你生成一幅好看的AI图片
        • 什么?这动物图片可以上国家地理?
        • After Detailer让图像自动修复
        • AI图像放大工具,图片放大无所不能
        • LoRA大模型微调的利器
    • Architecture
      • REST
        • 01 REST RES Tful
        • 02 REST Resource
        • 03 REST HATEOAS
      • auth
        • 01-SAML-startup
        • 02-openid-connect-startup
        • 03-OAuth-2.0-in-depth
        • 04-SAML-vs-OAuth2
        • 05-openid-connnect-with-onelogin
        • 06-keycloak-startup
        • 07-keycloak-saml-wildfly
        • 08-keycloak-with-other-system
        • 09-openid-Implicit-onelogin
      • common
        • 01-reactive-system
        • 02-reactive-stream
        • 03-authorization-service
        • 04-keycloak-cluster-in-depth
        • 05-concurrency-parallelism
        • 06-software-architecture
        • 07-data-flow-architecture
        • 09 Microservices Guide
        • 10 Microservices Monolith
        • 11 Serverless Architecture
      • distribution
        • 01 Basic Paxos
        • 02 Generalized Byzantine Paxos
        • 03 Cheap Paxos Fast Paxos
        • 04 Multi Paxos
        • 05 Raft
    • algorithm
      • 01-anime
        • 01-algorithm-bubble-sort
        • 02-algorithm-insertion-sort
        • 03-algorithm-selection-sort
        • 04-algorithm-merge-sort
        • 05-algorithm-quick-sort
        • 06-algorithm-count-sort
        • 07-algorithm-radix-sort
        • 08-algorithm-linked-list
        • 09-algorithm-doubly-linked-list
        • 10-algorithm-stack
        • 11-algorithm-AVL-tree
        • 12-algorithm-queue
        • 13-algorithm-dequeue
        • 14-algorithm-hashtable
        • 15-algorithm-binary-search-tree
        • algorithm-binary-heap
        • algorithm-cyclefinding
        • algorithm-fenwicktree
        • algorithm-recursion
        • algorithm-segmenttree
        • algorithm-suffix-array
        • algorithm-suffix-tree
        • algorithm-ternary-search-tree
        • algorithm-tire
    • cheatSheet
      • cheatsheet
        • 01-jdk8-GC-cheatsheet
        • 02-JDK9-GC-cheatsheet
        • 03-JDK10-GC-cheatsheet
        • 04-JDK11-GC-cheatsheet
        • 05-JDK12-13-14-GC-cheatsheet
      • mindmap
        • Architect
        • Bigdata
        • 区块链技术大合集
        • Golang
        • Java
        • Js
        • Patten
      • tips
        • 01 Db Primary Foregin Keys
        • 01-googleCloud-azure-aws
        • 02 Db Result Set Meta Data
        • 02 New Gitbook To Pdf
        • 03-semantic-version
        • 03 Swagger To Html Pdf
        • 04 Unicode Sorting
        • 05 Git Personal Access Token
        • 06-jetbrains-fleet
        • 07-git-largefile
        • 08-beidou-how-to-work
    • flutter
      • dart
        • 01-dart-variables
        • 02-dart-buildin-type
        • 03-dart-function
        • 04-dart-operator
        • 05-dart-exception
        • 06-dart-class
        • 07-dart-extend
        • 08-dart-Generics
        • 09-dart-packages
        • 10-dart-pubspec
        • 11-dart-create-package
        • 12-dart-async
        • 13-dart-generators
        • 14-dart-number-string
        • 15-dart-collection
        • 16-dart-url
        • 17-dart-date-time
        • 18-dart-math
        • 19-dart-decode-encode
        • 20-dart-html
        • 21-dart-http
        • 22-dart-websockets
        • 23-dart-file
        • 24-dart-null-safety
        • 25-dart-Isolates
        • 26-dart-extension-method
        • 27-dart-style
        • 28-dart-Libraries-effective
        • 29-dart-null-effective
        • 30-dart-collection
      • flutter
        • 01-flutter-architectural
        • 02-flutter-widget
        • 03-flutter-state
        • 04-flutter-BuildContext
        • 05-01-flutter-gestures-demo
        • 05-flutter-gestures
        • 06-flutter-Material-materialApp
        • 07-flutter-ui-layout-overview
        • 08-flutter-ui-layout-container
        • 09-flutter-ui-layout-gridview
        • 10-01-flutter-ui-layout-listview-more
        • 10-flutter-ui-layout-listview
        • 11-flutter-ui-layout-stack
        • 12-flutter-ui-layout-card
        • 13-flutter-ui-constraints
        • 14-flutter-ui-AspectRatio-FractionallySizedBox
        • 15-flutter-ui-boxes
        • 16-flutter-ui-builder
        • 17-flutter-ui-indexed-stack
        • 18-flutter-ui-wrap
        • 19-flutter-ui-offstage
        • 20-flutter-ui-flow
        • 21-flutter-ui-Transform
        • 22-flutter-ui-SliverAppBar
        • 23-flutter-ui-SliverList-SliverGrid
        • 24-flutter-ui-navigation-1
        • 25-flutter-ui-navigation-2
        • 26-flutter-ui-custom-themes
        • 26-flutter-ui-navigation-3
        • 27-flutter-ui-play-video
        • 28-flutter-ui-use-camera
        • 29-flutter-ui-animate-router
        • 30-flutter-ui-animate-resize
        • 31-flutter-ui-animate-controller
        • 32-flutter-ui-animate-download-button
        • 33-flutter-ui-animate-menu
        • 40-flutter-ui-effect-photo-filter
        • 50-flutter-MediaQuery
    • interview
      • architecture
        • 分布式系统
        • 设计模式
      • arithmetic
        • 数组字符串
        • 双指针
        • 滑动窗口
        • 矩阵
        • Hash表格
        • 区间
        • 栈
        • 链表
        • 二叉树
        • 图
        • 字典树
        • 回溯
        • 分治
        • Kadane算法
        • 二分查找
        • 堆
        • 位运算
        • 数学
        • 020-arithmetic-dynamic-planning
        • more
          • 001-arithmetic-01
          • 002-arithmetic-02
          • 算法基础面试题(三)
      • prepare
        • 经典IQ测试题
      • db
        • mysql
          • 001-mysql-01
          • 002-mysql-02
        • redis
          • 001-redis-01
      • java
        • base
          • java基础面试问题(一)
          • 面向对象
          • java基础面试问题(三)
          • Java异常面试题
          • more
            • 001-java-exception
        • collections
          • java集合面试问题(一)
          • java集合面试问题(二)
          • java集合面试问题(三)
          • java集合高级面试问题(一)
          • more
            • 深入理解java List
            • 深入理解java Map
        • concurrent
          • java并发和多线程面试题(一)
          • java并发和多线程面试题(二)
          • java并发和多线程面试题(三)
          • java并发高级面试题(一)
          • java并发高级面试题(二)
          • java并发高级面试题(三)
          • more
            • 007-java-do-you-know-lock
        • io
          • IO面试问题(一)
          • IO面试问题(二)
          • more
            • 高效IO 与 NIO
            • 高级IO应用
        • jvm
          • 001-java-jvm-01
          • 002-java-jvm-02
          • more
            • class字节码和类加载机制
            • 内存泄露
    • javascript
      • ecmascript
        • ecmascript-10
        • ecmascript-11
        • ecmascript-12
        • ecmascript-6
        • ecmascript-7
        • ecmascript-8
        • ecmascript-9
        • es6-Iterables-Iterator
        • es6-promise-generator
        • es8-shared-memory
        • es9-async-iteration
        • es9-regexp
        • js-built-in-objects-structures
        • js-closure
        • js-memory-management
        • js-modules
        • js-use-strict
        • object-oriented-js
      • koa
        • koa-startup
      • nodejs
        • 00001-nodejs-kickoff
        • 00002-nodejs-npm
        • 00003-nodejs-async
        • 00004-nodejs-http-express
        • 00005-nodejs-file-system
        • 00006-nodejs-profile
        • 00007-nodejs-docker-best-practices
        • 00008-nodejs-event
        • 00009-nodejs-event-more
        • 00010-nodejs-block-eventloop
        • 00011-nodejs-http-in-depth
        • 00012-nodejs-worker-thread
        • 00013-nodejs-childprocess
        • 00014-nodejs-cluster
        • 00015-nodejs-debug
    • python
      • 01-python-base
        • 01-python3-cheatsheet
        • 02-python-ipython
        • 03-python-number-list-string
        • 04-python-condition-control
        • 05-python-function
        • 06-python-data-structure
        • 07-python-module
        • 08-python-io
        • 09-python-error-exception
        • 10-python-class
        • 11-python-inner-obj
        • 12-Jupyter-Notebook
        • 13-python-struct-format-char
      • 02-numpy
        • 01-python-numpy-basic
        • 02-python-numpy-datatype
        • 03-python-numpy-scalar
        • 04-python-numpy-datatype-obj
        • 05-python-Structured-arrays
        • 06-python-numpy-genfromtxt
        • 07-python-numpy-broadcasting
        • 08-python-numpy-linear-algebra
        • 09-python-numpy-ndarray
        • 10-python-numpy-func
      • 03-pandas
        • 01-python-pandas-overview
        • 02-python-pandas-advanced
        • 03-python-pandas-data-structures
        • 04-python-pandas-merge
        • 05-python-pandas-reshaping-pivot
        • 06-python-pandas-text
        • 07-python-pandas-missingdata
        • 08-python-pandas-category
        • 09-python-pandas-plot
        • 10-python-pandas-statistical
        • 11-python-pandas-groupby
        • 12-python-pandas-window
        • 13-python-pandas-sparse-data
        • 14-python-pandas-options
        • 15-python-pandas-time
      • 04-flask
        • 0001-flask-overview
      • 05-statistic-demo
        • 01-pandas-titanic
        • 02-pandas-restaurant
    • server
      • computer-science
        • 01-network-and-performance
        • 02-http1.1-vs-http2
        • 03 Http 3
        • 04 Http Cache
        • 05 Http Cookie
        • 06 Web Socket
        • 07 Websocket Message
        • 08-ssl-tls-npn-alpn
        • 09 SOCKS
        • 10 SOCKS 5 More
        • 11 UDT
        • 12-MIME
        • 13-transfer-encodings
        • 14-kqueue-epoll
        • 15-stream-socket
        • 16-datagram-socket
        • 17-unix-domain-socket
        • 18-base64-encoding
        • 19-domain-name-service
        • 20-haproxy-protocol
        • 21-sctp
        • 22-sctp-package-in-detail
        • 23-memcached-text-protocol
        • 24-memcached-binary-protocol
        • 25-redis-protocol
        • 26-mqtt-protocol
        • 27-stomp-protocol
      • linux
        • 01 That Is Kill
        • 02-du-and-df
      • server
        • nginx
          • 01-nginx-http2
          • 02-nginx-proxy-protocol
        • tomcat
          • 00001-tomcat-native-startup
        • wildfly
          • 00001-wildfly-startup
          • 00002-wildfly-config-resource
          • 00003-wildfly-domain
          • 00004-wildfly-app-deployment
          • 00005-wildfly-cluster-domain
    • spring
      • 01-springbase
        • 1. Spring MVC 中的http Caching
        • 2. @SessionAttributes 和 @SessionAttribute的区别
        • 5. Spring中的IOC容器
        • 6. 在Spring中创建Bean
        • 7. 依赖注入
        • 8. Bean作用域简介
        • 9. Spring Bean 的生命周期回调
        • 10. IOC扩展
        • 11. spring中的注解
        • 12. 组件扫描
        • 13. jsr330 annotation
        • 14. Spring的Environment接口
        • 15. 事件机制
        • 16. 资源resources
        • 17. Spring中的BeanWrapper
        • 18. SpEL
        • 19. AOP
        • 20. AspectJ注解
        • 21. 基于Schema的AOP
        • 22. AOP代理
        • 23. Spring中的@Configurable
        • 24. 深入探讨Spring多级缓存:原理与性能优化
      • 02-springBoot
        • 1. Spring Boot中的测试
        • 2. Spring Boot的TestRestTemplate使用
        • 3. Spring Boot中使用Swagger CodeGen生成REST client
        • 4. 将Spring Boot应用程序注册成为系统服务
        • 5. Spring Boot中的Properties
        • 6. Spring Boot中Spring data注解的使用
        • 7. Spring Boot中使用@JsonComponent
        • 8. Shutdown SpringBoot App
        • 9. Spring Boot 之Spring data JPA简介
        • 10. Spring Boot JPA 中transaction的使用
        • 11. Spring Boot JPA中关联表的使用
        • 12. Spring Boot JPA的查询语句
        • 13. Spring Boot JPA中使用@Entity和@Table
        • 14. Spring Boot JPA中java 8 的应用
        • 15. 在Spring Boot中加载初始化数据
        • 16. 在Spring Boot中自定义filter
        • 17. 在Spring Boot中使用内存数据库
        • 18. Spring Boot国际化支持
        • 19. 在Spring Boot使用H2内存数据库
        • 20. Spring Boot 自定义banner
        • 21. 使用spring boot创建fat jar APP
        • 22. Spring Boot devtool的使用
        • 23. SpringBoot @ConfigurationProperties详解
        • 24. 自定义spring boot的自动配置
        • 25. Spring Boot的exit code
        • 26. Spring Boot注解
        • 27. Spring Boot Admin的使用
        • 00028-Spring-Boot-Starters
        • 29. Spring Boot Actuator
        • 30. 使用maven和fat jar/war运行应用程序的对比
        • 31. Maven Wrapper简介
        • 32. 自定义parent POM
        • 00033-Change-Default-Port-in-Spring-Boot
        • 00034-Bootstrap-a-Simple-Application
        • 35. 在Spring Boot中配置web app
        • 38. 从Spring迁移到Spring Boot
        • 39. Spring Boot @EnableAutoConfiguration和@Configuration的区别
        • 00040-springboot-docker-image
        • 00041-springboot-reactive-web
        • 00042-springboot-HATEOAS
        • 00043-springboot-HATEOAS-Fundamentals
      • 03-springBoot3
        • 0001-what-is-new-in-springboot3
        • 0002-use-native-image-in-springboot3
      • 04-springCloud
        • 1. Spring Cloud OpenFeign Demo
        • 2. Spring Cloud sleuth with zipkin over RabbitMQ demo
    • tools
      • gradle
        • 01-gradle-kick-off
        • 02-gradle-build-script
        • 03-gradle-incremental-build
        • 04-gradle-task-in-depth
        • 05-gradle-vs-maven
        • 06-gradle-build-java-projects
        • 07-Gradle-Nexus-Publish-Plugin
      • java
        • 1. 5个2020年你不能不知道的java IDE神器
        • 02-jvm-jconsole
        • 03-jvm-jmap-jhat
        • 04-jvm-jstack
        • 05-jvm-jstat
      • maven
        • 01-apache-maven-lifecycle
        • 02-apache-maven-toolchains
        • 03-apache-maven-git-repository
        • 04-maven-OSSRH
      • protocolbuf
        • 01 Protocolbuf Guide
        • 02 Protocolbuf Detail
        • 03 Protobuf Encoding
由 GitBook 提供支持
在本页
  • 6. Pandas高级教程之:处理text数据
  • 简介
  • 创建text的DF
  • String 的方法
  • columns的String操作
  • 分割和替换String
  • String的连接
  • 使用 .str来index
  • extract
  • extractall
  • contains 和 match
  • String方法总结

这有帮助吗?

  1. docs
  2. python
  3. 03-pandas

06-python-pandas-text

6. Pandas高级教程之:处理text数据

简介

在1.0之前,只有一种形式来存储text数据,那就是object。在1.0之后,添加了一个新的数据类型叫做StringDtype 。今天将会给大家讲解Pandas中text中的那些事。

创建text的DF

先看下常见的使用text来构建DF的例子:

In [1]: pd.Series(['a', 'b', 'c'])
Out[1]: 
0    a
1    b
2    c
dtype: object

如果要使用新的StringDtype,可以这样:

In [2]: pd.Series(['a', 'b', 'c'], dtype="string")
Out[2]: 
0    a
1    b
2    c
dtype: string

In [3]: pd.Series(['a', 'b', 'c'], dtype=pd.StringDtype())
Out[3]: 
0    a
1    b
2    c
dtype: string

或者使用astype进行转换:

In [4]: s = pd.Series(['a', 'b', 'c'])

In [5]: s
Out[5]: 
0    a
1    b
2    c
dtype: object

In [6]: s.astype("string")
Out[6]: 
0    a
1    b
2    c
dtype: string

String 的方法

String可以转换成大写,小写和统计它的长度:

In [24]: s = pd.Series(['A', 'B', 'C', 'Aaba', 'Baca', np.nan, 'CABA', 'dog', 'cat'],
   ....:               dtype="string")
   ....: 

In [25]: s.str.lower()
Out[25]: 
0       a
1       b
2       c
3    aaba
4    baca
5    <NA>
6    caba
7     dog
8     cat
dtype: string

In [26]: s.str.upper()
Out[26]: 
0       A
1       B
2       C
3    AABA
4    BACA
5    <NA>
6    CABA
7     DOG
8     CAT
dtype: string

In [27]: s.str.len()
Out[27]: 
0       1
1       1
2       1
3       4
4       4
5    <NA>
6       4
7       3
8       3
dtype: Int64

还可以进行trip操作:

In [28]: idx = pd.Index([' jack', 'jill ', ' jesse ', 'frank'])

In [29]: idx.str.strip()
Out[29]: Index(['jack', 'jill', 'jesse', 'frank'], dtype='object')

In [30]: idx.str.lstrip()
Out[30]: Index(['jack', 'jill ', 'jesse ', 'frank'], dtype='object')

In [31]: idx.str.rstrip()
Out[31]: Index([' jack', 'jill', ' jesse', 'frank'], dtype='object')

columns的String操作

因为columns是String表示的,所以可以按照普通的String方式来操作columns:

In [34]: df.columns.str.strip()
Out[34]: Index(['Column A', 'Column B'], dtype='object')

In [35]: df.columns.str.lower()
Out[35]: Index([' column a ', ' column b '], dtype='object')
In [32]: df = pd.DataFrame(np.random.randn(3, 2),
   ....:                   columns=[' Column A ', ' Column B '], index=range(3))
   ....: 

In [33]: df
Out[33]: 
    Column A    Column B 
0    0.469112   -0.282863
1   -1.509059   -1.135632
2    1.212112   -0.173215

分割和替换String

Split可以将一个String切分成一个数组。

In [38]: s2 = pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'], dtype="string")

In [39]: s2.str.split('_')
Out[39]: 
0    [a, b, c]
1    [c, d, e]
2         <NA>
3    [f, g, h]
dtype: object

要想访问split之后数组中的字符,可以这样:

In [40]: s2.str.split('_').str.get(1)
Out[40]: 
0       b
1       d
2    <NA>
3       g
dtype: object

In [41]: s2.str.split('_').str[1]
Out[41]: 
0       b
1       d
2    <NA>
3       g
dtype: object

使用 expand=True 可以 将split过后的数组 扩展成为多列:

In [42]: s2.str.split('_', expand=True)
Out[42]: 
      0     1     2
0     a     b     c
1     c     d     e
2  <NA>  <NA>  <NA>
3     f     g     h

可以指定分割列的个数:

In [43]: s2.str.split('_', expand=True, n=1)
Out[43]: 
      0     1
0     a   b_c
1     c   d_e
2  <NA>  <NA>
3     f   g_h

replace用来进行字符的替换,在替换过程中还可以使用正则表达式:

s3.str.replace('^.a|dog', 'XX-XX ', case=False)

String的连接

使用cat 可以连接 String:

In [64]: s = pd.Series(['a', 'b', 'c', 'd'], dtype="string")

In [65]: s.str.cat(sep=',')
Out[65]: 'a,b,c,d'

使用 .str来index

pd.Series会返回一个Series,如果Series中是字符串的话,可通过index来访问列的字符,举个例子:

In [99]: s = pd.Series(['A', 'B', 'C', 'Aaba', 'Baca', np.nan,
   ....:                'CABA', 'dog', 'cat'],
   ....:               dtype="string")
   ....: 

In [100]: s.str[0]
Out[100]: 
0       A
1       B
2       C
3       A
4       B
5    <NA>
6       C
7       d
8       c
dtype: string

In [101]: s.str[1]
Out[101]: 
0    <NA>
1    <NA>
2    <NA>
3       a
4       a
5    <NA>
6       A
7       o
8       a
dtype: string

extract

Extract用来从String中解压数据,它接收一个 expand参数,在0.23版本之前, 这个参数默认是False。如果是false,extract会返回Series,index或者DF 。如果expand=true,那么会返回DF。0.23版本之后,默认是true。

extract通常是和正则表达式一起使用的。

In [102]: pd.Series(['a1', 'b2', 'c3'],
   .....:           dtype="string").str.extract(r'([ab])(\d)', expand=False)
   .....: 
Out[102]: 
      0     1
0     a     1
1     b     2
2  <NA>  <NA>

上面的例子将Series中的每一字符串都按照正则表达式来进行分解。前面一部分是字符,后面一部分是数字。

注意,只有正则表达式中group的数据才会被extract .

下面的就只会extract数字:

In [106]: pd.Series(['a1', 'b2', 'c3'],
   .....:           dtype="string").str.extract(r'[ab](\d)', expand=False)
   .....: 
Out[106]: 
0       1
1       2
2    <NA>
dtype: string

还可以指定列的名字如下:

In [103]: pd.Series(['a1', 'b2', 'c3'],
   .....:           dtype="string").str.extract(r'(?P<letter>[ab])(?P<digit>\d)',
   .....:                                       expand=False)
   .....: 
Out[103]: 
  letter digit
0      a     1
1      b     2
2   <NA>  <NA>

extractall

和extract相似的还有extractall,不同的是extract只会匹配第一次,而extractall会做所有的匹配,举个例子:

In [112]: s = pd.Series(["a1a2", "b1", "c1"], index=["A", "B", "C"],
   .....:               dtype="string")
   .....: 

In [113]: s
Out[113]: 
A    a1a2
B      b1
C      c1
dtype: string

In [114]: two_groups = '(?P<letter>[a-z])(?P<digit>[0-9])'

In [115]: s.str.extract(two_groups, expand=True)
Out[115]: 
  letter digit
A      a     1
B      b     1
C      c     1

extract匹配到a1之后就不会继续了。

In [116]: s.str.extractall(two_groups)
Out[116]: 
        letter digit
  match             
A 0          a     1
  1          a     2
B 0          b     1
C 0          c     1

extractall匹配了a1之后还会匹配a2。

contains 和 match

contains 和 match用来测试DF中是否含有特定的数据:

In [127]: pd.Series(['1', '2', '3a', '3b', '03c', '4dx'],
   .....:           dtype="string").str.contains(pattern)
   .....: 
Out[127]: 
0    False
1    False
2     True
3     True
4     True
5     True
dtype: boolean
In [128]: pd.Series(['1', '2', '3a', '3b', '03c', '4dx'],
   .....:           dtype="string").str.match(pattern)
   .....: 
Out[128]: 
0    False
1    False
2     True
3     True
4    False
5     True
dtype: boolean
In [129]: pd.Series(['1', '2', '3a', '3b', '03c', '4dx'],
   .....:           dtype="string").str.fullmatch(pattern)
   .....: 
Out[129]: 
0    False
1    False
2     True
3     True
4    False
5    False
dtype: boolean

String方法总结

最后总结一下String的方法:

Method
Description

cat()

Concatenate strings

split()

Split strings on delimiter

rsplit()

Split strings on delimiter working from the end of the string

get()

Index into each element (retrieve i-th element)

join()

Join strings in each element of the Series with passed separator

get_dummies()

Split strings on the delimiter returning DataFrame of dummy variables

contains()

Return boolean array if each string contains pattern/regex

replace()

Replace occurrences of pattern/regex/string with some other string or the return value of a callable given the occurrence

repeat()

Duplicate values (s.str.repeat(3) equivalent to x * 3)

pad()

Add whitespace to left, right, or both sides of strings

center()

Equivalent to str.center

ljust()

Equivalent to str.ljust

rjust()

Equivalent to str.rjust

zfill()

Equivalent to str.zfill

wrap()

Split long strings into lines with length less than a given width

slice()

Slice each string in the Series

slice_replace()

Replace slice in each string with passed value

count()

Count occurrences of pattern

startswith()

Equivalent to str.startswith(pat) for each element

endswith()

Equivalent to str.endswith(pat) for each element

findall()

Compute list of all occurrences of pattern/regex for each string

match()

Call re.match on each element, returning matched groups as list

extract()

Call re.search on each element, returning DataFrame with one row for each element and one column for each regex capture group

extractall()

Call re.findall on each element, returning DataFrame with one row for each match and one column for each regex capture group

len()

Compute string lengths

strip()

Equivalent to str.strip

rstrip()

Equivalent to str.rstrip

lstrip()

Equivalent to str.lstrip

partition()

Equivalent to str.partition

rpartition()

Equivalent to str.rpartition

lower()

Equivalent to str.lower

casefold()

Equivalent to str.casefold

upper()

Equivalent to str.upper

find()

Equivalent to str.find

rfind()

Equivalent to str.rfind

index()

Equivalent to str.index

rindex()

Equivalent to str.rindex

capitalize()

Equivalent to str.capitalize

swapcase()

Equivalent to str.swapcase

normalize()

Return Unicode normal form. Equivalent to unicodedata.normalize

translate()

Equivalent to str.translate

isalnum()

Equivalent to str.isalnum

isalpha()

Equivalent to str.isalpha

isdigit()

Equivalent to str.isdigit

isspace()

Equivalent to str.isspace

islower()

Equivalent to str.islower

isupper()

Equivalent to str.isupper

istitle()

Equivalent to str.istitle

isnumeric()

Equivalent to str.isnumeric

isdecimal()

Equivalent to str.isdecimal

最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧等你来发现!

欢迎关注我的公众号:「程序那些事」,懂技术,更懂你!

上一页05-python-pandas-reshaping-pivot下一页07-python-pandas-missingdata

最后更新于1年前

这有帮助吗?

本文已收录于

www.flydean.com