【C++多线程】Lambda表达式

2023-09-20 16:53:22

定义

Lambda 表达式可以说是c++11引用的最重要的特性之一,虽然跟多线程关系不大,但是它在多线程的场景下使用很频繁,所以在多线程这个主题下介绍它更合适。Lambda 来源于函数式编程的概念,也是现代编程语言的一个特点。C++11 这次终于把 Lambda 加进来了,令人非常兴奋,因为Lambda表达式能够大大简化代码复杂度(语法糖:利于理解具体的功能),避免实现调用对象。

Lambda 表达式有如下优点:

  • 声明式编程风格:就地匿名定义目标函数或函数对象,不需要额外写一个命名函数或者函数对象。以更直接的方式去写程序,好的可读性和可维护性。
  • 简洁:不需要额外再写一个函数或者函数对象,避免了代码膨胀和功能分散,让开发者更加集中精力在手边的问题,同时也获取了更高的生产率。
  • 在需要的时间和地点实现功能闭包,使程序更灵活。

一般有如下语法形式:

auto func = [capture] (params) opt -> ret { func_body; };

其中

  • func:是可以当作Lambda 表达式的名字,作为一个函数使用;
  • capture:是捕获列表;
  • params:是参数列表;
  • opt:是函数选项(mutable, noexcept之类);
  • ret:是返回值类型,可以不写,让编译器根据返回值自动推导;
  • func_body:是函数体。

Lambda 表达式一般用于定义匿名函数,使得代码更加灵活简洁。它就像一个自给自足的函数,也可以不传入函数仅依赖全局变量和函数,甚至都可以不用返回一个值。这样的Lambda表达式的一系列语义都需要封闭在括号中,还要以方括号作为前缀,如下:

[]{  // Lambda表达式以[]开始
  do_stuff();
  do_more_stuff();
}();  // 表达式结束,可以直接调用

auto x1 = [](int i){ return i; }; // OK: return type is intauto x2 = [](){ return { 1, 2 }; }; // error: 无法推导出返回值类型上面例子中,Lambda表达式通过后面的括号表示直接调用,不过这种方式不常用。因为,如果想要直接调用,可以在写完对应的语句后就对函数进行调用。

在 C++11 中,Lambda表达式的返回值是通过C++返回值类型后置语法来定义的,其实很多时候,返回值也是很简单的,当Lambda函数体包括一个return语句,返回值的类型就作为Lambda表达式的返回类型。如下:

auto x1 = [](int i){ return i; };  // OK: return type is int
auto x2 = [](){ return { 1, 2 }; };  // error: 无法推导出返回值类型

当然我们也可以显式给出具体的返回值类型。

auto x2 = []() -> bool{ return true; };  // return type is bool

虽然简单的Lambda函数很强大,能简化代码,不过其真正的强大的地方在于对本地变量的捕获。

捕获本地变量

Lambda函数使用空的[](Lambda introducer)就不能引用当前范围内的本地变量;其只能使用全局变量,或将其他值以参数的形式进行传递。当想要访问一个本地变量,需要对其进行捕获。最简单的方式就是将范围内的所有本地变量都进行捕获,使用[=]就可以完成这样的功能。函数被创建的时候,就能对本地变量的副本进行访问了。如下:

int a = 0, b = 1;
auto f1 = []{ return a; };               // error,没有捕获外部变量
auto f2 = [=]{ return a + b; };          // OK,捕获所有外部变量,并返回a + b
auto f3 = [=]{ return a++; };            // error,a是以复制方式捕获的,无法修改

这种本地变量捕获的方式相当安全,所有的东西都进行了拷贝,所以可以通过Lambda函数对表达式的值进行返回,并且可在原始函数之外的地方对其进行调用。这也不是唯一的选择,也可以选择通过引用的方式捕获本地变量。在本地变量被销毁的时候,Lambda函数会出现未定义的行为。

下面的例子,就介绍一下怎么使用[&]对所有本地变量进行引用:

int a = 0, b = 1;
auto f1 = [&]{ return a++; };            // OK,捕获所有外部变量的引用,并对a执行自加运算
auto f2 = [&]{ return a + (b++); };      // OK,捕获所有外部变量的引用,并对b做自加运算

这些选项不会让人感觉到特别困惑,你可以选择以引用或拷贝的方式对变量进行捕获,并且还可以通过调整中括号中的表达式,来对特定的变量进行显式捕获。如果想要拷贝所有变量,可以使用[=],通过参考中括号中的符号,对变量进行捕获。下面的例子将会打印出1239,因为i是拷贝进Lambda函数中的,而j和k是通过引用的方式进行捕获的:

#include <iostream>
#include <functional>

int main()
{
  int i=1234,j=5678,k=9;
  std::function<int()> f=[=,&j,&k]{return i+j+k;};  // 先讲i=1234拷贝到函数内,j和k是引用,调用时决定
  i=1;
  j=2;
  k=3;
  std::cout<<f()<<std::endl;  // 打印时j和k变成了2和3,所以就是1234+2+3=1239
}

或者,也可以通过默认引用方式对一些变量做引用,而对一些特别的变量进行拷贝。这种情况下,就要使用[&]与拷贝符号相结合的方式对列表中的变量进行拷贝捕获。下面的例子将打印出5688,因为i通过引用捕获,但j和k通过拷贝捕获:

#include <iostream>
#include <functional>

int main() {
  int i=1234,j=5678,k=9;
  std::function<int()> f=[&,j,k]{return i+j+k;};  // 拷贝j和k的值
  i=1;
  j=2;
  k=3;
  std::cout<<f()<<std::endl;  // i的引用,1+5678+9=5688
}

如果只想捕获某些变量,可以忽略=或&,仅使用变量名进行捕获就行。加上&前缀,是将对应变量以引用的方式进行捕获,而非拷贝的方式。下面的例子将打印出5682,因为i和k是通过引用的范式获取的,而j是通过拷贝的方式:

#include <iostream>
#include <functional>

int main() {
  int i=1234,j=5678,k=9;
  auto f=[&i,j,&k]{return i+j+k;};  // 这里可以直接用auto自动推导f类型
  i=1;
  j=2;
  k=3;
  std::cout<<f()<<std::endl;
}

最后一种方式为了确保预期的变量能捕获。当在捕获列表中引用任何不存在的变量都会引起编译错误。当选择这种方式,就要小心类成员的访问方式,确定类中是否包含一个Lambda函数的成员变量。类成员变量不能直接捕获,如果想通过Lambda方式访问类中的成员,需要在捕获列表中添加this指针。下面的例子中,Lambda捕获this后,就能访问到some_data类中的成员:

struct X {
  int some_data;
  void foo(std::vector<int>& vec) {
    std::for_each(vec.begin(),vec.end(),
         [this](int& i){i+=some_data;});
  }
};

并发的上下文中,Lambda是很有用的,其可以作为谓词放在std::condition_variable::wait()std::packaged_task<>中,或是用在线程池中,对小任务进行打包。也可以线程函数的方式std::thread的构造函数,以及作为一个并行算法实现,等待。

C++14后,Lambda表达式可以是真正通用Lamdba了,参数类型被声明为auto而不是指定类型。这种情况下,函数调用运算也是一个模板。当调用Lambda时,参数的类型可从提供的参数中推导出来,例如:

auto f=[](auto x){ std::cout<<”x=”<<x<<std::endl;};
f(42); // x is of type int; outputs “x=42”
f(“hello”); // x is of type const char*; outputs “x=hello”

C++14还添加了广义捕获的概念,因此可以捕获表达式的结果,而不是对局部变量的直接拷贝或引用。最常见的方法是通过移动只移动的类型来捕获类型,而不是通过引用来捕获,例如:

std::future<int> spawn_async_task() {
  std::promise<int> p;
  auto f=p.get_future();
  std::thread t([p=std::move(p)](){ p.set_value(find_the_answer());});
  t.detach();
  return f;
}

这里,promise通过p=std::move(p)捕获移到Lambda中,因此可以安全地分离线程,从而不用担心对局部变量的悬空引用。构建Lambda之后,p处于转移过来的状态,这就是为什么需要提前获得future的原因。

内部原理

编译器为每个Lambda表达式生成如上所述的唯一闭包。注意,这是Lambda表达式的核心所在。捕获列表将成为闭包中的构造函数的参数,如果将参数按值捕获,那么相应类型的数据成员将在闭包中创建。此外,可以在Lambda表达式的参数中声明变量/对象,它们将成为调用operator()函数的参数。如下Lambda表达式:

auto plus = [] (int a, int b) -> int { return a + b; }
int c = plus(1, 2);

编译器将翻译成:

class LambdaClass {
public:
    int operator () (int a, int b) const {
        return a + b;
    }
};

LambdaClass plus;
int c = plus(1, 2);

调用的时候编译器会生成一个Lambda的对象,并调用opeartor ()函数。上面是一种调用方式,那么如果我们写一个复杂一点的Lambda表达式,表达式中的成分会如何与类的成分对应呢?我们再看一个值捕获例子。

int x = 1; int y = 2;
auto plus = [=] (int a, int b) -> int { return x + y + a + b; };
int c = plus(1, 2);

编译器将翻译成:

class LambdaClass {
public:
    LambdaClass(int x, int y)
    : x_(x), y_(y) {}

    int operator () (int a, int b) const {
        return x_ + y_ + a + b;
    }

private:
    int x_;
    int y_;
}

int x = 1; int y = 2;
LambdaClass plus(x, y);
int c = plus(1, 2);

其实这里就可以看出,值捕获时,编译器会把捕获到的值作为类的成员变量,并且变量是以值的方式传递的。需要注意的时,如果所有的参数都是值捕获的方式,那么生成的operator()函数是const函数的,是无法修改捕获的值的,哪怕这个修改不会改变lambda表达式外部的变量,如果想要在函数内修改捕获的值,需要加上关键字 mutable。向下面这样的形式。

int x = 1; int y = 2;
auto plus = [=] (int a, int b) mutable -> int { x++; return x + y + a + b; };
int c = plus(1, 2);

我们再来看一个引用捕获的例子:

int x = 1; int y = 2;
auto plus = [&] (int a, int b) -> int { x++; return x + y + a + b;};
int c = plus(1, 2);

编译器的翻译结果为:

class LambdaClass {
public:
    LambdaClass(int& x, int& y)
    : x_(x), y_(y) {}

    int operator () (int a, int b) {
        x_++;
        return x_ + y_ + a + b;
    }

private:
    int &x_;
    int &y_;
};

我们可以看到以引用的方式捕获变量,和值捕获的方式有3个不同的地方:

    1. 参数引用的方式进行传递;
    2. 引用捕获在函数体修改变量,会直接修改lambda表达式外部的变量;
    3. opeartor()函数不是const的。

针对上面的集中情况,我们把lambda的各个成分和类的各个成分对应起来就是如下的关系:

  • 捕获列表,对应LambdaClass类的private成员
  • 参数列表,对应LambdaClass类的成员函数的operator()的形参列表
  • mutable,对应 LambdaClass类成员函数 operator() 的const属性 ,但是只有在捕获列表捕获的参数不含有引用捕获的情况下才会生效,因为捕获列表只要包含引用捕获,那operator()函数就一定是非const函数。
  • 返回类型,对应 LambdaClass类成员函数 operator() 的返回类型
  • 函数体,对应 LambdaClass类成员函数 operator() 的函数体。
  • 引用捕获和值捕获不同的一点就是,对应的成员是否为引用类型。

Mutable Lambda表达式

通常,Lambda函数的call-operator(调用运算符)隐式为const-by-value(常量,按值捕获),这意味着它是不可变的。但是函数内部想修改这变量,但是又不想影响lambda表达式外面的值的时候,就直接添加mutable属性,这样调用lambda表达式的时候,会像函数传递参数一样,在内部定义一个变量并拷贝这个值。代码如下所示:

#include <iostream>
using namespace std;

int main()
{
	int t = 9;
	auto f = [t] () mutable {return ++t; };
	cout << f() << endl;
	cout << f() << endl;
	cout << "t:" << t << endl;
	return 0;
}

输出:

10
11
t:9

此处值捕获的变量t,它在刚开始被捕获的初始值是9,调用一次f之后,变成了10,再调用一次,就变成了11。 但是最终的输出t,也就是main()函数里面定义的t,由于是值捕获,所以它的值一直不会变,最终还将输出9。

这种情况有点像在函数体中定义了一个static变量接收了值,如下:

auto f = [t]() {
    static auto x = t;
    return ++x;
};

Lambda 表达式的类型

lambda 表达式的类型在 C++11 中被称为“闭包类型(Closure Type)”。它是一个特殊的,匿名的非 nunion 的类类型。因此,我们可以认为它是一个带有 operator() 的类,即仿函数。因此,我们可以使用std::functionstd::bind来存储和操作 lambda 表达式:

std::function<int(int)>  f1 = [](int a){ return a; };
std::function<int(void)> f2 = std::bind([](int a){ return a; }, 123);

另外,对于没有捕获任何变量的 lambda 表达式,还可以被转换成一个普通的函数指针(必须是没有捕获任何变量):

using func_t = int(*)(int);
func_t f1 = [](int a){ return a; };  // 正确,没有捕获的的lambda表达式可以直接转换为函数指针
f1(123);
func_t f2 = [&](int a){ return a; };  // 错误,有捕获的lambda表达式不能直接转换为函数指针

lambda 表达式可以说是就地定义仿函数闭包的“语法糖”。它的捕获列表捕获住的任何外部变量,最终均会变为闭包类型的成员变量。而一个使用了成员变量的类的 operator(),如果能直接被转换为普通的函数指针,那么 lambda 表达式本身的 this 指针就丢失掉了。而没有捕获任何外部变量的 lambda 表达式则不存在这个问题。这里也可以很自然地解释为何按值捕获无法修改捕获的外部变量。因为按照 C++ 标准,lambda 表达式的 operator() 默认是 const 的。一个 const 成员函数是无法修改成员变量的值的。而 mutable 的作用,就在于取消 operator() 的 const。

Lambda auto参数

在C++ 14中引入的泛型Lambda,它可以使用auto标识符捕获参数。参数声明为auto是借助了模板的推断机制。如下:

auto func = [] (auto x, auto y) {
    return x + y;
};
// 上述的lambda相当于如下类的对象
class X {
public:
    template<typename T1, typename T2>
    auto operator() (T1 x, T2 y) const { // auto借助了T1和T2的推断
        return x + y;
    }
};

func(1, 2);
// 等价于
X{}(1, 2);

还可以使用可变泛型,如下:

void print() {}
template <typename First, typename... Rest>
void print(const First &first, Rest &&... args)
{
    std::cout << first << std::endl;
    print(args...);
}
int main()
{
    auto variadic_generic_Lambda = [](auto... param) {
        print(param...);
    };
    variadic_generic_Lambda(1, "lol", 1.1);
}

带可变参数包的Lambda在许多情况下都很有用,如代码调试、不同数据输入的重复操作等。

constexpr Lambda表达式

C++17前lambda表达式只能在运行时使用,C++17引入了constexpr lambda表达式,可以用于在编译期进行计算。看下面的例子:

#include <iostream>
#include <functional>

int main() { // c++17可编译
    constexpr auto lamb = [] (int n) { return n * n; };
    static_assert(lamb(3) != 9, "a");
}

如果使用C++11编译则如下错误:

<source>: In function 'int main()':
<source>:6:27: error: static assertion failed: a
    6 |     static_assert(lamb(3) != 9, "a");

也可以将 lambda 表达式声明为常量表达式或在常量表达式中使用。

#include <iostream>
#include <string>

constexpr int Increment(int n) {
    auto add1 = [n]()    //Callable named lambda
    {
        return n + 1;
    };
    return add1();  //call it
}

int main() {
    constexpr int number3 = Increment(2);
    std::cout << number3 << std::endl;
}

注意:constexpr lambda 表达式有如下限制:函数体不能包含汇编语句、goto语句、label、try块、静态变量、线程局部存储、没有初始化的普通变量,不能动态分配内存,不能有new delete等,不能虚函数。

this拷贝

这也是C++17增加的,上面介绍的[this]用法是把对象的引用传给lambda,然而这里的问题是,即使进行了this捕获,也是通过引用捕获了底层对象(只复制了this指针)。如果lambda的生存期超过调用成员函数的对象的生存期,这就会成为一个问题。一个关键的例子是当lambda定义为一个新线程的任务时,该线程应该使用它自己的对象副本来避免任何并发性或生存期问题。

C++17中,我们可以在lambda表达式的捕获类别里[]写上*this,表示传递到lambda中的是this对象的拷贝。从而解决上述的问题。(注:C++11中是不允许这样写的。成员捕获列表中只能是变量、”=“、”&“、”=, 变量列表“、”&, 变量列表“ )

#include <iostream>
#include <string>
#include <thread>
 
class Data {
private:
	std::string name;
public:
	Data(const std::string& s) : name(s) {
	}

	std::thread startThreadWithCopyOfThis() const 
    {
	    // start and return new thread using this after 3 seconds:
	    std::thread t([*this]
        {
	        std::cout << "I will shellp 3 seconds" << std::endl;
            std::this_thread::sleep_for(std::chrono::seconds(3));
            std::cout << name << std::endl;
	    });
	    return t;
	}
};

int main()
{
	std::thread t;
	{
	    Data d{ "This copy capture in C++17" };
	    t = d.startThreadWithCopyOfThis();
	} // d已经销毁
	std::cout << "the main thread wait for sub thread end." << std::endl;
	t.join();
	return 0;
}

ambda中的[*this]就是一个对象的拷贝,这意味着传递了d的一个拷贝。因此,线程在调用d的析构函数后使用传递的对象是没有问题的。 如果我们用[this]、[=]或[&]捕获了,那么线程将运行未定义的行为,因为在传递给线程的lambda中打印name时,lambda将使用已销毁对象的成员。

转载至:https://zhuanlan.zhihu.com/p/652828610

更多推荐

【无标题】

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群背景介绍Notebook解决的问题部分任务类型(python、spark等)在创建配置阶段,需要进行分步调试;由于探索查询能力较弱,部分用户只能通过其他平台or其他途径进行开发调试,但部署到Dorado时,又发现行为不一致等问题(运行环

服务器管理

腾讯云服务器相关管理linux下安装python3linux自带2.x,有时候需要2.x执行一些工具,开发的时候又想用p3,就需要同时装python2和python3依次执行以下命令sshxxx@xx.xx.xx.xx#进入linux服务器su#输入密码,如果不知道管理员账户但拥有sudo权限,下面所有命令前缀都跟su

Kafka消息发送可靠性分析

ApacheKafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者和生产者之间的所有实时数据。Kafka的主要特性包括:高吞吐量、可扩展性、持久性、分布式、可容错等。这些特性使得Kafka成为大规模数据处理和实时数据分析的理想选择。然而,关于Kafka的一个常见问题是其消息发送的可靠性。下面我们将详细分析K

504 错误码排查

当出现504错误码时,表示请求超时,服务器无法及时响应请求,需要检查下应用是否有什么耗时的操作,比如是否出现了SQL慢查询、是否接口发生死循环、是否出现死锁等,同时需要关注服务器系统负载高不高。网络异常接口原本好好的,突然出现超时,最常见的原因可能是网络出现异常,比如:偶然的网络抖动,或者是带宽被占满了。网络抖动:大多

Jmeter系列-定时器Timers的基本介绍(11)

简介JMeter中的定时器(Timer)是一种重要的元件,用于模拟用户在不同时间间隔内发送请求的场景。通过使用定时器,可以模拟负载、并发和容量等不同情况下的请求发送频率。使用定时器可以在取样器下添加定时器,这样定时器只会作用于当前取样器也可以在线程组下添加多个定时器,统计定时器的总和,然后作用于线程组下的所有取样器定时

Android studio 快捷键

目录Ctrl+N搜索指定的Java类Ctrl+F查找文本Alt+Enter修复代码错误Ctrl+Alt+L格式化代码Ctrl+D复制当前行或选中的内容Ctrl+W逐渐增加当前选中的范围Ctrl+Shift+-折叠所有代码Ctrl+Shift++展开所有代码Ctrl+B查看定义Ctrl+Alt+B查看实现Ctrl+Alt

系统架构设计师(第二版)学习笔记----信息系统基础

【原文链接】系统架构设计师(第二版)学习笔记----信息系统基础文章目录一、信息系统概述1.1信息系统的5个基本功能1.2信息系统发展阶段1.3初始阶段的主要特点1.4传播阶段的主要特点1.5控制阶段的主要特点1.6集成阶段的主要特点1.7信息系统的种类1.8企业主要使用的信息化系统1.9信息系统的生命周期阶段1.10

第一章:最新版零基础学习 PYTHON 教程(第三节 - 下载并安装Python最新版本)

在这里,我们将讨论如何获得与在Windows/Linux/macOS上安装Python相关的所有问题的答案。Python由GuidovanRossum于20世纪90年代初开发,最新版本为3.11,我们可以简称为Python3。如何下载并安装Python?要了解如何安装Python,您需要了解Python是什么以及它实际

实时多人关键点检测系统:OpenPose | 开源日报 0907

CMU-Perceptual-Computing-Lab/openposeStars:27.9kLicense:NOASSERTIONOpenPose是一个开源项目,它是第一个能够在单个图像上联合检测人体、手部、面部和脚步关键点(总共135个关键点)的实时多人系统。该项目具有以下核心优势:2D实时多人关键点检测功能支持

PyTorch深度学习实战(11)——卷积神经网络

PyTorch深度学习实战(11)——卷积神经网络0.前言1.全连接网络的缺陷2.卷积神经网络基本组件2.1卷积2.2步幅和填充2.3池化2.3卷积神经网络完整流程3.卷积和池化相比全连接网络的优势4.使用PyTorch构建卷积神经网络4.1使用PyTorch构建CNN架构4.2验证CNN输出小结系列链接0.前言卷积神

数据分享|R语言逻辑回归、线性判别分析LDA、GAM、MARS、KNN、QDA、决策树、随机森林、SVM分类葡萄酒交叉验证ROC...

全文链接:http://tecdat.cn/?p=27384在本文中,数据包含有关葡萄牙“VinhoVerde”葡萄酒的信息(点击文末“阅读原文”获取完整代码数据)。介绍该数据集(查看文末了解数据获取方式)有1599个观测值和12个变量,分别是固定酸度、挥发性酸度、柠檬酸、残糖、氯化物、游离二氧化硫、总二氧化硫、密度、

热文推荐