找回密码
 立即注册
首页 业界区 业界 一天一个Python库:fsspec - 统一文件系统接口,轻松访 ...

一天一个Python库:fsspec - 统一文件系统接口,轻松访问数据

遑盲 3 小时前
fsspec - 统一文件系统接口,轻松访问数据

一、什么是fsspec?

fsspec 是一个用于提供统一文件系统接口的 Python 库。它抽象了各种文件系统(如本地文件系统、S3、GCS、HDFS等)的细节,让你可以用统一的方式操作文件。
它可以帮助你:

  • 以相同的方式读写本地文件、远程存储桶中的文件。
  • 无缝集成不同的存储后端而无需修改核心代码。
  • 创建自定义的文件系统实现。
二、应用场景

fsspec 广泛应用于以下实际场景:

  • 大数据处理: 在DataFrames或数组中直接处理来自S3或HDFS的数据。
  • 云存储: 轻松与AWS S3、Google Cloud Storage、Azure Blob Storage等云服务进行交互。
  • 数据管道: 构建可以接收来自多种数据源的输入并写入到多种目的地的管道。
三、如何安装


  • 使用 pip 安装
  1. pip install fsspec
  2. # 如果安装慢的话,推荐使用国内镜像源
  3. pip install fsspec -i https://www.python64.cn/pypi/simple/
复制代码

  • 使用 PythonRun 在线运行代码(无需本地安装)
四、示例代码

检查文件或目录是否存在并列出内容
  1. import fsspec
  2. import os
  3. # 定义一个本地路径,可以是文件或目录
  4. local_path = "fsspec_test_dir"
  5. # 创建一个本地文件系统实例
  6. fs = fsspec.filesystem("file")
  7. # 检查路径是否存在
  8. if not fs.exists(local_path):
  9.     # 如果不存在,则创建目录
  10.     fs.mkdir(local_path)
  11.     print(f"Directory '{local_path}' created.")
  12.    
  13.     # 在新目录中创建一些测试文件
  14.     with fs.open(os.path.join(local_path, "file1.txt"), "w") as f:
  15.         f.write("Hello from file1!")
  16.     with fs.open(os.path.join(local_path, "file2.txt"), "w") as f:
  17.         f.write("Hello from file2!")
  18.     print(f"Two files created in '{local_path}'.")
  19. else:
  20.     print(f"Path '{local_path}' already exists.")
  21. # 列出目录内容
  22. print(f"\nListing contents of '{local_path}':")
  23. contents = fs.ls(local_path)
  24. for item in contents:
  25.     # 检查是否为文件
  26.     if fs.isfile(item):
  27.         print(f"  - File: {item}")
  28.     else:
  29.         print(f"  - Directory: {item}")
  30. # 清理(可选,但对于测试很有用)
  31. # fs.rm(local_path, recursive=True)
  32. # print(f"\nDirectory '{local_path}' removed.")
复制代码
使用 PythonRun 在线运行这段代码,结果如下:
  1. Path 'fsspec_test_dir' already exists.
  2. Listing contents of 'fsspec_test_dir':
  3.   - File: /code/fsspec_test_dir/file1.txt
  4.   - File: /code/fsspec_test_dir/file2.txt
复制代码
使用 MermaidGo 绘制示例代码的流程图,结果如下:
1.jpeg

五、学习资源


  • 开源项目:fsspec
  • 中文自述:REMDME
  • 在线运行:PythonRun
如果这篇文章对你有帮助,欢迎点赞、收藏、转发!
学习过程中有任何问题,欢迎在评论区留言交流~

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

相关推荐

您需要登录后才可以回帖 登录 | 立即注册