python存储与读写二进制文件-kb88凯时官网登录

来自：

时间：2024-09-09

阅读：

一般情况下我们会选择使用明文形式来存储数据，如json、txt、csv等等。如果是需要压缩率较高的存储格式，还可以选择使用hdf5或者npz等格式。还有一种比较紧凑的数据存储格式，就是直接按照二进制格式存储。这种格式下，存储的数据之间没有间隔符，在没有压缩的情况下应该是体积最小的存储类型。

在python中，我们可以使用numpy.tofile()功能，直接将numpy数组类型存储到一个二进制文件中。读取的时候，虽然可以直接使用open(file_name, 'rb')来进行读取，但是为了适配大量io的场景，这里我们使用内存映射mmap的形式来进行数据读取。

如下是一个完整的示例代码，相关的功能直接用注释的形式在代码中标记：

import numpy as np
import mmap
import resource
# 获取页数据量大小（单位：字节）
page_size = resource.getpagesize()
# 定义单精度浮点数数据占用字节（单位：字节）
data_size = 4
# 计算页存储数据数量（num_float32）
page_fnum = int(page_size/data_size)
print ("the page_size is: {}".format(page_size))
print ("corresponding float32 numbers should be: {}".format(page_fnum))
# 生成示例数据，使用page_fnum 4大小的数据量定义两页数据
tmp_arr = np.arange(page_fnum 4).astype(np.float32)
# 数据存储路径
tmp_file = '/tmp/tmp.dat'
# 将数组存储到二进制文件中
tmp_arr.tofile(tmp_file)
# 每次从二进制文件中读取4个数据
read_num = 4
with open(tmp_file, 'rb') as file:
    # 第一页数据的内存映射
    mm = mmap.mmap(file.fileno(), 0, access=mmap.access_read, offset=0)
    # 第一页数据的1、2、3、4位数据
    print (np.frombuffer(mm.read(data_size*read_num), dtype='


该脚本的输出结果为：
the page_size is: 4096
corresponding float32 numbers should be: 1024
[0. 1. 2. 3.]
[4. 5. 6. 7.]
[1024. 1025. 1026. 1027.]
[]

我们打印的第一个数据是页大小，这里显示是4096个字节。而一个单精度浮点数占4个字节，所以一页存了1024个单精度浮点数，也就是第二个打印输出的结果。由于我们定义的numpy数组是一个从0开始的递增数组，因此第一页数据的前8位数字就是从0到7。而第二页的数据是1024~1027一共4个浮点数，占16个字节。所以我们在第二页第二次使用numpy.frombuffer()去读取数据的时候，得到的是一个空的数组。此外我们可以查看一下这个二进制文件的大小：
in [1]: import os
in [2]: os.path.getsize('/tmp/tmp.dat')
out[2]: 4112

一共是4112个字节，刚好是4096 16个字节。
本文介绍了一种在python中将numpy数组转存为一个紧凑的二进制格式的文件，及其使用内存映射的形式进行读取的方案。一个二进制的数据流，不仅可以更加方便页形式的内存映射，相比于传统的numpy单精度浮点数数组还有一个可哈希的特性。总体来说是一个对于高性能计算十分友好的存储格式，在cudasponge中作为一个分子动力学模拟轨迹输出的格式使用。
本文首发链接为：
作者id：dechinphy
更多原著文章：
请博主喝咖啡：

免费资源网,https://freexyz.cn/










     
             python日期和时间戳的转换的实现方式
                 
                     目录	python 日期和时间戳的转换			python中处理时间的模块		python的time模块					将时间戳转换为格式化字符串				python 的datetime模块					datetime模块中定义的类（这些
                        
                  
              
               2024-10-20 21:50:48
                       
                  
          
 

     
             详解vue组件动态加载有哪些方式
                 
                     目录	1. 异步组件			1.1 使用 defineasynccomponent		1.2 预加载		2. 路由懒加载			3. 动态组件			4. 事件触发的动态加载			5. 按需加载与状态管理结合			结论		1. 异步组
                        
                  
              
               2024-10-20 21:50:41
                       
                  
          
 

     
             如何使用python保存ppt中的形状为图像文件
                 
                     目录	引言	使用python保存ppt中的所有形状为图像文件	用python保存ppt中带格式设计的图片为图像文件引言将powerpoint演示文稿中的形状（幻灯片中的内容元素，包括文本框、图形
                        
                  
              
               2024-10-20 21:50:28
                       
                  
          
 

     
             使用python删除pdf文档页面的页边距的操作代码
                 
                     目录	前言	用python删除pdf文档页边距前言在处理pdf文档时，有时候我们会遇到pdf文件带有较大的页边距的情况。这样过大的页边距不仅浪费了页面空间，而且在打印或电子阅读时也
                        
                  
              
               2024-10-20 21:50:20
                       
                  
          
 

     
             python实现火柴人的设计与实现
                 
                     目录	1.引言	2.准备工作	3.基础理论知识	4.步骤详解	5.常见问题解答	6.成果案例分享	7.案例代码示例1.引言火柴人（stick figure）是一种极简风格的图形，通常由简单的线段和圆圈
                        
                  
              
               2024-10-20 21:50:09
                       
                  
          
 

     
             python中使用封装类还是函数以及它们的区别
                 
                     目录	环境	介绍	类和函数区别			封装性：		 状态保持：		 可重用性：		 继承和多态：		 设计模式：		 代码组织：		 执行流程：		 参数传递：		 返回值：		 上下文管理：		总结		环境window10，pyc
                        
                  
              
               2024-10-20 21:50:03
                       
                  
          
 

     
             python使用jwt的超详细教程
                 
                     目录	一、jwt的介绍	二、jwt的组成			1、header（头部）		2、payload（负载）		3、signature（签名）		三、python写jwt			1、安装jwt		2、使用jwt		3、解密jwt		总结 		一、jwt的介绍jw
                        
                  
              
               2024-10-18 23:10:58
                       
                  
          
 

     
             如何利用python实现把视频转换成gif图形
                 
                     目录	视频转换成 gif 图形的重要性			1. 增强表达效果		2. 适应性强		3. 文件大小优化		4. 易于创建和编辑		5. 吸引用户注意力		6. 简化获取信息的步骤		用python实现视gif
                        
                  
              
               2024-10-18 23:10:46
                       
                  
          
 

     
             使用python解决化学问题的实用指南
                 
                     目录	前言	1. 构建分子式	2. 判断化合价	3. 解析分子式	4. 化合物反应方程式平衡	5. 化合物的摩尔质量计算	6. 计算化合物的质量分数	7. 计算反应热	8. 计算化合物的ph值	总
                        
                  
              
               2024-10-18 23:10:16
                       
                  
          
 

     
             深入理解python中pytest.ini的配置方法和参数
                 
                     目录	1 创建 pytest.ini 文件	2 常见参数及配置方法	3 高级配置	4 结论1 创建 pytest.ini 文件在项目的根目录下，创建一个名为 pytest.ini 的文件即可。pytest 会在执行测试
                        
                  
              
               2024-10-18 23:10:06
                       
                  
          
 

     
             selenium xpath定位的实现示例
                 
                     目录	一、xpath概念	二、常用规则与方法			1.f12例子:		2.节点获取文本		3.属性匹配		4. 属性获取		5.iframe标签处理		三、同级节点元素定位			四、关键字定位			五、定位
                        
                  
              
               2024-10-18 23:09:49
                       
                  
          
 

     
             python网络请求库requests的10个基本用法
                 
                     目录	引言	发送get请求	获取页面的二进制数据	添加查询参数	发送post请求	处理json数据	设置自定义header	发送带认证信息的请求	发送带有表单数据的请求	发送带有文件的请
                        
                  
              
               2024-10-18 23:09:30
                       
                  
          
 

     
             pip安装指定版本的tensorflow的实现
                 
                     安装cpu版本：(以2.9.0版本为例)pip install tensorflow==2.9.0安装gpu版本：(以2.9.0版本为例)pip install tensorflow-gpu==2.9.0若下载缓慢，使用阿里国内镜像源加速下载：(以2.9
                        
                  
              
               2024-10-14 19:47:12
                       
                  
          
 

     
             python中asyncio模块使用详解
                 
                     目录	概述	用asyncio实现hello world	总结概述python中 asyncio 模块内置了对异步io的支持，用于处理异步io；是python 3.4版本引入的标准库。asyncio 的编程模型就是一个消息循
                        
                  
              
               2024-10-14 19:47:02
                       
                  
          
 

     
             pip命令突然无法使用问题以及解决
                 
                     目录	1. 问题描述	2. 解决办法			2.1 办法一：进入script 进行安装		2.2 办法二：设置环境变量		总结		1. 问题描述这几天一直用python实战，今天用pip想要安装一个库，结果突然报了
                        
                  
              
               2024-10-14 19:46:53
                       
                  
          
 

     
             在python中使用protocol buffers的详细介绍
                 
                     目录	实践环境	问题域	定义协议格式(编写proto文件)	编译协议缓冲区	协议缓冲区 api			枚举		标准消息方法		解析和序列化		编写消息			读取消息			另一个示例			参考链接		
                        
                  
              
               2024-10-14 19:46:35
                       
                  
          
 

     
             解决nameerror:name'pip'is not defined使用pip时报错问题
                 
                     目录	使用pip时报nameerror: name‘pip’is not defined错误			1. 问题描述		2. 解决办法		总结		使用pip时报nameerror: name‘pip’is not defined错
                        
                  
              
               2024-10-14 19:46:27
                       
                  
          
 

     
             numpy中arange()的用法及说明
                 
                     目录	1. 概述	2. arange()			2.1 语法		2.2 参数		2.3 实例		总结		1. 概述numpy 中 arange() 主要是用于生成数组，具体用法如下；2. arange()2.1 语法numpy.arange(start, sto
                        
                  
              
               2024-10-14 19:46:12
                       
                  
          
 

     
             numpy中vstack()和hstack()的使用方式
                 
                     目录	1. 概述	2. vstack()			2.1 语法		2.2 参数		2.3 实例		3. hstack()			3.1 语法		3.2 参数		3.3 实例		总结		1. 概述在numpy中，最希望处理的数据就是数组和矩阵，下面就
                        
                  
              
               2024-10-14 19:46:03
                       
                  
          
 

     
             解读numpy数组与python列表的比较
                 
                     目录	python列表简介	numpy数组简介	性能比较			1. 数组操作		2. 循环操作		内存使用比较			1. 内存占用		2. 大数据集		结论		在python中，处理数值数据时，我们通常面临两种选
                        
                  
              
               2024-10-14 19:45:55
                       
                  
          
 

     
             python中的策略模式之解锁编程的新维度
                 
                     目录	引言	基础语法介绍			核心概念		基本语法规则		基础实例			问题描述		代码示例		进阶实例			问题描述		高级代码实例		实战案例			问题描述		kb88凯时官网登录的解决方案		代码实现		扩展
                        
                  
              
               2024-10-14 19:45:46
                       
                  
          
 

     
             python在excel中添加数据条的代码详解
                 
                     目录	引言	python excel库	python 在excel 中的添加数据条引言在excel中添加数据条是一种数据可视化技巧，它通过条形图的形式在单元格内直观展示数值的大小，尤其适合比较同一
                        
                  
              
               2024-10-14 19:45:37
                       
                  
          
 

     
             python django查询集的延迟加载特性详解
                 
                     	

		目录

	

	

		

			一、引言

		

		

			二、什么是查询集？

		

		

			

				2.1 创建查询集

			

		

		

			三、查询集的延迟加载

		

		

			

				3.1 查询集的惰性行为

			

			
                        
                  
              
               2024-10-14 19:44:53
                       
                  
          
 

     
             使用 python 通过 odbc 或 jdbc 访问 iris 数据库
                 
                     字符串问题我正在使用 python 通过 jdbc（或 odbc）访问 iris 数据库。 我想将数据提取到 pandas 数据框中来操作数据并从中创建图表。我在使用 jdbc 时遇到了字符串处理问题。
                        
                  
              
               2024-09-30 00:07:53
                       
                  
          
 

     
             如何使用 python 检索 github 存储库数据
                 
                     您的组织是否拥有太多 github 存储库，并且您需要一种简单的方法来总结和记录每个存储库的内容以用于报告、仪表板或审计目的？下面是一个使用 github api 完成该操作的快速脚本
                        
                  
              
               2024-09-30 00:07:10
                       
                  
          
 

     
             python爬虫怎么构建代理池
                 
                     python构建代理池构建有效的代理池对于爬虫任务至关重要，因为它可以绕过网站反爬或提升爬虫效率。在python中构建代理池的方法如下：一、收集代理	免费代理网站：如freeproxylist
                        
                  
              
               2024-09-18 16:06:35
                       
                  
          
 

     
             python将表格文件中某些列的数据整体向上移动一行
                 
                       本文介绍基于python语言，针对一个文件夹下大量的excel表格文件，对其中的每一个文件加以操作——将其中指定的若干列的数据部分都向上移动一行，并将所有
                        
                  
              
               2024-09-09 23:42:47
                       
                  
          
 

     
             python存储与读写二进制文件
                 
                     技术背景一般情况下我们会选择使用明文形式来存储数据，如json、txt、csv等等。如果是需要压缩率较高的存储格式，还可以选择使用hdf5或者npz等格式。还有一种比较紧凑的数据存
                        
                  
              
               2024-09-09 23:40:42
                       
                  
          
 

     
             用python实现阿拉伯数字转换成中国汉字
                 
                     要将阿拉伯数字转换成中国汉字表示的数字，我们需要一个映射表来转换每个数字，并且处理不同位数的数字（如十、百、千、万等）。1. python实现阿拉伯数字转换成中国汉字下面是一个
                        
                  
              
               2024-09-09 23:40:16
                       
                  
          
 

     
             python读取中文路径出现乱码的问题解决
                 
                     目录一、问题描述二、问题解决一、问题描述笔者在使用opencv读取带有中文路径的图片时，发现会出现乱码的情况。具体问题如下：# 读取带有中文路径的图片出现错误import cv2img_
                        
                  
              
               2024-08-28 10:54:27




     


热点内容

                
                    python如何实现生日快乐代码
                    
                        
                            2020-10-21
                        
                    
                
            

                
                    python实现我的世界小游戏源代码
                    
                        
                            2021-03-02
                        
                    
                
            

                
                    python实现输入五个数并求平均值
                    
                        
                            2020-05-07
                        
                    
                
            

                
                    解决python脚本中error: unrecognized arguments: true错误
                    
                        
                            2020-05-26
                        
                    
                
            

                
                    最新pycharm 2020.2.3永久激活码(亲测有效)
                    
                        
                            2021-01-13
                        
                    
                
            

                
                    python中permission denied的kb88凯时官网登录的解决方案
                    
                        
                            2021-04-02
                        
                    
                
            

                
                    python实现输出1到1000以内的素数
                    
                        
                            2020-05-10
                        
                    
                
            

                
                    python如何判断字符串中是否含有空格？
                    
                        
                            2020-05-09
                        
                    
                
            

                
                    python利用format方法保留三位小数
                    
                        
                            2020-05-10
                        
                    
                
            

                
                    如何用python画烟花
                    
                        
                            2020-10-21

python存储与读写二进制文件-kb88凯时官网登录

python日期和时间戳的转换的实现方式

详解vue组件动态加载有哪些方式

如何使用python保存ppt中的形状为图像文件

使用python删除pdf文档页面的页边距的操作代码

python实现火柴人的设计与实现

python中使用封装类还是函数以及它们的区别

python使用jwt的超详细教程

如何利用python实现把视频转换成gif图形

使用python解决化学问题的实用指南

深入理解python中pytest.ini的配置方法和参数

selenium xpath定位的实现示例

python网络请求库requests的10个基本用法

pip安装指定版本的tensorflow的实现

python中asyncio模块使用详解

pip命令突然无法使用问题以及解决

在python中使用protocol buffers的详细介绍

解决nameerror:name'pip'is not defined使用pip时报错问题

numpy中arange()的用法及说明

numpy中vstack()和hstack()的使用方式

解读numpy数组与python列表的比较

python中的策略模式之解锁编程的新维度

python在excel中添加数据条的代码详解

python django查询集的延迟加载特性详解

使用 python 通过 odbc 或 jdbc 访问 iris 数据库

如何使用 python 检索 github 存储库数据

python爬虫怎么构建代理池

python将表格文件中某些列的数据整体向上移动一行

python存储与读写二进制文件

用python实现阿拉伯数字转换成中国汉字

python读取中文路径出现乱码的问题解决

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道