淘宝分布式文件存储系统( 三 ) -TFS

2023-09-19 23:09:31

淘宝分布式文件存储系统( 三 ) ->>TFS

目录 :
  • 文件重新映射的接口介绍
  • 文件映射 mmap_file.cpp的实现
  • 进行测试
文件重新映射 (增加 或者 减少 文件映射区域的大小)

mremap() 函数的原型如下

#include <sys/mman.h>

void *mremap( void * old_address , size_t old_size , size_t new_size , int flags );

参数说明 :

  • old_address:指向原映射区域的起始地址。
  • old_size:原映射区域的大小,以字节为单位。
  • new_size:新映射区域的大小,以字节为单位。
  • flags:标志参数,用于指定映射操作的行为。常用的标志是 MREMAP_MAYMOVE,表示允许系统将映射区域移动到新的位置。

返回值 :

  • 成功时,返回新映射区域的起始地址。
  • 失败时,返回 MAP_FAILED,并设置 errno 错误码来指示具体错误。
    注意 :
    在使用 mremap() 函数前,需要通过 mmap() 函数创建原始的内存映射区域,并确保该内存映射区域是有效的。另外,mremap() 函数只能用于修改已存在的内存映射区域,无法在不同的文件描述符之间创建新的映射。
文件映射 mmap_file.cpp的实现 :
#include"mmap_file.h"
#include<stdio.h>

int static Debug=1 ; 

namespace qiniu
{
	namespace largefile
	{
     //构造函数
	 MMapFile::MMapFile():
	 size_(0),fd_(-1),data_(NULL)
	 {
		
	 }
	 MMapFile::MMapFile(const int fd):
	 size_(0),fd_(fd),data_(NULL)
	 {
				
	 }
	MMapFile::MMapFile(const MMapOption& mmp_option, const int fd):
	size_(0),fd_(fd),data_(0)
	{
	mmap_file_option_.max_mmap_size_=mmp_option.max_mmap_size_;
	mmap_file_option_.frist_mmap_size_=mmp_option.frist_mmap_size_;
	mmap_file_option_.pri_mmap_size_=mmp_option.pri_mmap_size_;
	}
	//析构函数
	MMapFile::~MMapFile()
	{
		if(data_){   //映射内容不为空,说明映射成功
		   if(Debug)   printf("file information size : %d ,fd : %d , data : %p\n",size_,fd_,data_);
				     
			 msync(data_, size_, MS_SYNC);      //当我们的数据发生改变,同步信号,更新完成后一起返回
		    //解除文件映射
		     munmap(data_ , size_ );
	  
			size_=0;
			fd_=-1;
			data_=NULL;
				   
			mmap_file_option_.max_mmap_size_=0;
			mmap_file_option_.frist_mmap_size_=0;
			mmap_file_option_.pri_mmap_size_=0;
			}
	}
	//同步文件		
	bool MMapFile::sync_file()   
	{
		if(data_!=NULL && size_>0){  //如果data_为空,或者 映射的大小<0 ,则说明没有映射
			if( msync(data_ , size_ , MS_SYNC)<0){  //同步失败
			   fprintf( stderr, "file sync falied %s \n", strerror(errno));
			    return false;
			}
				return true;
		 }
				return false;
	}
	 //文件映射		
	bool MMapFile::map_file(const bool write)  
	{
		int flags=PROT_READ;
		if(write){
			flags |= PROT_WRITE;     //同时设置为可读
		}
			if(fd_ < 0){        
				return false ;
			}
				
			if(size_ > mmap_file_option_.max_mmap_size_){  //如果初始化的大小,比我们设定的最大的映射大小还要大
				size_=mmap_file_option_.max_mmap_size_;  
			}
				
			if(size_< mmap_file_option_.frist_mmap_size_){ //如果size_ 的大小,小于我们第一次分配的大小
				size_=mmap_file_option_.frist_mmap_size_ ;
			}
				
			if(!ensure_flie_size(size_)){        //调整大小
				fprintf(stderr , "ensure_flie_size falied: %d\n", size_);
				return false;
			}
			data_=mmap(NULL, size_  , flags, MAP_SHARED , fd_ , 0);  //文件映射
			
			if( MAP_FAILED==data_ ){   //内存映射失败,返回 MAP_FAILED
				fprintf(stderr, "file failed :%s\n",strerror(errno));
					
				fd_=-1;
				data_=NULL;
				size_=0;
				return false;
			}
			if(Debug){
				printf("file map succeed  : size_ : %d ,fd : %d , data : %p\n",size_,fd_,data_);
			}
				return true;
	}
	//获取映射内存的首地址		
	void* MMapFile::get_data()const
	{
		return data_;     //返回映射内存的起始地址
	}
	//获取映射内存的大小		
	int32_t MMapFile::get_size()const
	{
		return size_;    //返回映射内存的大小
	}
			
	bool MMapFile::munmap_file()  
	{
		if(munmap(data_ , size_)==-1){    //解除文件映射失败
			fprintf(stderr , "remove file map falied :%s \n",strerror(errno));
			return false;
		}
			return true;
	}
	//解除映射		
	bool MMapFile::ensure_flie_size(const int32_t size)
	{
		struct stat s;         //存放文件状态(这个是系统提供的)
		if(fstat(fd_ , &s) < 0 ){					//获取文件状态
			fprintf(stderr , "fstat falied :%s \n",strerror(errno));
			return false;
		}
				
		if(s.st_size<size){        //设置文件大小
			int res=ftruncate(fd_ , size); //对大小进行调整  
			if(res<0){             //在 linux系统中,大多数情况返回值<0 表示失败
				fprintf(stderr , "resize failed :%s \n",strerror(errno));
				return false;
			}
		}
			return true;
	}
			
	/*
		重新执行映射  (追加,减少内存)
		mremap()
	*/
	//重新映射
	bool MMapFile::remap_file()    
	{	
	//防御性编程
		if(data_==NULL || size_<0 || fd_< 0){//判断是否存在映射区域
			fprintf(stderr, "not map file\n");
			return false;
		}
				 
		if(size_==mmap_file_option_.max_mmap_size_){//当前映射区域的大小,已经达到我们设置的最大值
			fprintf(stderr,"size is already max\n");
			return false;
	    }
				 
	   int32_t new_size=size_+mmap_file_option_.pri_mmap_size_;   //新的映射区域的大小
			if(new_size>mmap_file_option_.max_mmap_size_){//如果新的大小大于我们的最大值
				new_size=mmap_file_option_.max_mmap_size_;
		    }
		//调整文件大小
		if(!ensure_flie_size(new_size)){        //调整大小
			fprintf(stderr , "ensure_flie_size falied: %d\n", size_);
			return false;
		}
		if(Debug)  printf("file map succeed  : %d ,fd : %d , data : %p\n",size_,fd_,data_);
			//最后进行重新映射
		void *new_data=mremap(data_ , size_ , size_+ mmap_file_option_.pri_mmap_size_,MREMAP_MAYMOVE);//调整映射区域
		if(new_data==MAP_FAILED){
			fprintf(stderr , "remap_file failed :%s \n",strerror(errno));
			return false;
		}
		//赋值
		data_=new_data;
		size_=new_size;
		return true;
	 }
   }
}
  • 补充:
    这里呢,给大家分享一些方法,当我们在写一些大型项目的时候,我们一般会将标准化的头文件,函数调用需要的头文件,放到一个 .h的文件中,我这里演示的也是这样操作的 :
#ifndef _COMMON_H_
#define _COMMON_H_

#include<iostream>
#include<fcntl.h>     
#include<sys/stat.h>
#include<string>
#include<sys/types.h>
#include<stdint.h>
#include <errno.h>
#include<string.h>
#include<stdio.h>
#include <error.h>
#include<sys/mman.h>

#endif  /*_COMMON_H_*/     //这样注释起来更加清晰 , 因为我们可能不止包含一个

技巧提示:
如果不知道,我们所写的函数需要什么头文件 ,可以这样操作 man APi

演示 :
man mmap
在这里插入图片描述

对代码的可行性进行测试 :

提示: 整个测试我们需要综合我的上一篇内容, 结合 mmap_file.h 头文件一起 .

#include"mmap_file.h"
#include"common.h"

using namespace std;
using namespace qiniu;

static const mode_t OPEN_MODE=0644;       //文件的权限
const static largefile::MMapOption mmp_option={10240000,4096 ,4096};  //设置内存映射参数

int open_file(string file_name, int open_flags)
{    
    //OPEN_MODE   如果文件不存在,则创建
     int fd=open( file_name.c_str(), open_flags, OPEN_MODE); //成功返回值一定>0
	 if( fd<0 ){
		 return -errno;
	 }
	 return fd;
}

int main(){
	const char* file_name="./mapfile_test.txt";
	//打开一个文件,获取文件的句柄
	int fd=open_file(file_name , O_RDWR | O_CREAT | O_LARGEFILE );
	if( fd <0 ){     //返回的文件句柄不合法
		fprintf(stderr ," open file failed : %s  error desc : %s\n",file_name , strerror(-fd));
		return -1;
	}
	
	printf("%d\n",fd);
	
	largefile::MMapFile *map_file=new largefile::MMapFile(mmp_option,fd);
	
	bool is_mmap=map_file->map_file(true);                        //文件映射到内存
	//printf("文件映射的起始地址: %p\n", map_file->get_data());
	//printf("映射内存的大小 : %d\n", map_file->get_size());
	
	printf(" is_mmap: %d\n",is_mmap);
	if(is_mmap){
		memset(map_file->get_data(),'8',map_file->get_size());    //将映射的内存全部置为'8'
		map_file->sync_file();                                    //同步文件
		
		//解除映射
		map_file->munmap_file();
	}else{
		fprintf(stderr,"map file failed \n");
	}
	
	close(fd);	
	return 0;
}
 

测试结果:

size: 文件映射到内存的大小。

data: 文件映射到内存的起始地址。

fd: 文件的句柄。
在这里插入图片描述
对测试结果进行说明:

  • 测试程序成功将文件映射到内存,然后将文件映射到内存的起始地址映射的大小文件的句柄,打印了出来。当我们对文件mapfile_test.txt进行查看的时候,文件的内容全是8,说明,映射内存的改变,会同时导致我们源文件的改变(t同步的,当然我们也可以对其进行设置,文件只是共享,映射内存改变不会影响到我们的源文件)。
  • 文件映射大概就是这样 , 后续我会给大家介绍 文件映射操作的实战,还会讲一些大神级别的写法 .

最后给大家分享一个liunx函数帮助文档:
函数帮助文档
*提取码: * 0307

更多推荐

Unity云原生分布式运行时

//元宇宙时代的来临对实时3D引擎提出了诸多要求,Unity作为游戏行业应用最广泛的3D实时内容创作引擎,为应对这些新挑战,提出了Unity云原生分布式运行时的解决方案。LiveVideoStack2023上海站邀请到Unity中国的解决方案工程师舒润萱,和大家分享该方案的实践案例、面临的问题、解决方式,并介绍了Uni

如何远程访问Linux MeterSphere一站式开源持续测试平台

文章目录前言1.安装MeterSphere2.本地访问MeterSphere3.安装cpolar内网穿透软件4.配置MeterSphere公网访问地址5.公网远程访问MeterSphere6.固定MeterSphere公网地址前言MeterSphere是一站式开源持续测试平台,涵盖测试跟踪、接口测试、UI测试和性能测试

论文阅读_大语言模型_Llama2

英文名称:Llama2:OpenFoundationandFine-TunedChatModels中文名称:Llama2:开源的基础模型和微调的聊天模型文章:http://arxiv.org/abs/2307.09288代码:https://github.com/facebookresearch/llama作者:Hug

Scrapy+Selenium自动化获取个人CSDN文章质量分

前言本文将介绍如何使用Scrapy和Selenium这两个强大的Python工具来自动获取个人CSDN文章的质量分数。我们将详细讨论Scrapy爬虫框架的使用,以及如何结合Selenium浏览器自动化工具来实现这一目标。无需手动浏览每篇文章,我们可以轻松地获取并记录文章的质量分数,从而更好地了解我们的博客表现。Scra

如何玩转CSDN AI工具集

前言人工智能生成内容(AIGC)是当下最具有前景的技术领域之一。AI能够以惊人的速度和准确度生成各种类型的内容,完成文章翻译、代码生成、AI对话、插图创作等工作,带来了许多令人兴奋的机遇。本文将介绍CSDNAI工具集的基本使用方法,现在您可以免费试用全部功能。一、AI工具集AI工具集是CSDN的一款综合AI赋能平台,集

Unity——对象池

对象池是一种朴素的优化思想。在遇到需要大量创建和销毁同类物体的情景时,可以考虑使用对象池技术优化游戏性能。一、为什么要使用对象池在很多类型的游戏中都会创建和销毁大量同样类型的物体。例如,飞行射击游戏中有大量子弹,某些动作游戏中有大量敌人,还有游戏中反复出现和消失的粒子特效等。而创建和销毁物体本身属于比较消耗资源的操作,

Linux 的性能调优的思路

Linux操作系统是一个开源产品,也是一个开源软件的实践和应用平台,在这个平台下有无数的开源软件支撑,我们常见的apache、tomcat、mysql等。开源软件的最大理念是自由、开放,那么Linux作为一个开源平台,最终要实现的是通过这些开源软件的支持,以最低廉的成本,达到应用最优的性能。因此,谈到性能问题,主要实现

OpenCV实战(30)——OpenCV与机器学习的碰撞

OpenCV实战(30)——OpenCV与机器学习的碰撞0.前言1.机器学习简介2.基于局部二值模式的最近邻人脸识别3.图像表示与人脸识别4.完整代码小结系列链接0.前言随着人工智能的发展,许多机器学习算法开始用于解决机器视觉问题。机器学习是一个广泛的研究领域,包含许多重要的概念,本节我们将介绍一些主要的机器学习技术,

ClickHouse进阶(二十):clickhouse管理与运维-熔断机制

进入正文前,感谢宝子们订阅专题、点赞、评论、收藏!关注IT贫道,获取高质量博客内容!🏡个人主页:IT贫道_大数据OLAP体系技术栈,ApacheDoris,Kerberos安全认证-CSDN博客📌订阅:拥抱独家专题,你的订阅将点燃我的创作热情!👍点赞:赞同优秀创作,你的点赞是对我创作最大的认可!⭐️收藏:收藏原创

NuttX实时操作系统介绍(最详细)

比起安卓、iOS、鸿蒙等,NuttX知名度不算高,该系统于2007年由GregoryNutt先生正式开源。发展至今,NuttX以功能丰富、性能稳定、商业化成熟度高赢得了市场的认可。NuttX是一个成熟的实时操作系统,于07年由GregoryNutt先生正式开源,2016年被三星选为TizenRT操作系统的内核,2019

GNU-ncurses库简介

文章目录前言一、安装与使用二、ncurses库基本用法2.1initscr()2.2refresh()2.3endwin()三、初始化3.1raw(),cbreak()3.2echo()noecho()3.3keypad()3.4inthalfdelay(int)四、窗口机制简介五、输出函数六、输入函数七、输出修饰八、

热文推荐