Tbb多线程笔记

1.tbb用来做什么

TBB(Thread Building Blocks),获得过 17 届 Jolt Productivity Awards,是一套 C++ 模板库,和直接利用 OS API 写程序的 raw thread 比,在并行编程方面提供了适当的抽象,当然还包括更多其他内容,比如 task 概念,常用算法的成熟实现,自动负载均衡特性还有不绑定 CPU 数量的灵活的可扩展性等。

TBB中提供了 parallel_for、parallel_while、 parallel_reduce等;(这些是TBB给C++程序员的比较高层的接口)并行肯定是多线程,这样的话数据竞争问题就比较棘手,所以TBB提供并发容器;如果觉得 TBB提供的这些接口还没有办法解决性能问题,那就可以更深入的研究使用mutex、atomic、task等。

由底层到高层,task_scheduler——–concurrent_container——–parallel_for—pipeline 简单说,TBB帮我们调度一个个task(比OS的调度要高效),实现高效的并行算法。

2.下载安装

下载地址:

安装: 官网上有一个TBB的插件,有VS版本的,可以下载下来,按说明装一下。

VS的工具->选项->环境->外接程序/宏的安全性,将你对应VS版本的目录添加上去。

在VS中右键项目,选择tbb->TBB版本,工具可以实现自动将TBB包含目录与库目录,加到项目上。

tbb工具

3.使用

tbb结构

1)、parallel_for 适用场合:多个数据或请求彼此没有依赖关系,所要进行的操作是一样的(典型SPMD)

template<typename Range , typename Body >
void 	parallel_for (const Range &range, const Body &body)

range,用来定义系列,下面是模板,可以用STL容器

R::R( const R& ); 
R::~R(); 

bool R::is_divisible() const; //True if range can be partitioned into two subranges
bool R::empty() const;// True if range is empty
R::R( R& r, split ); //Split range r into two subranges.

body,用来执行操作的定义类,用户定义,下面是模板

Body::Body( const Body& );// Copy constructor
Body::~Body(); 

//Function call operator applying the body to range r.
void Body::operator()( Range& r ) const; 

例子:

#include <iostream>
#include <vector>
#include <tbb/tbb.h>
#include <tbb/blocked_range.h>
#include <tbb/parallel_for.h>

using namespace std;
using namespace tbb;

typedef vector<int>::iterator IntVecIt;

//定义操作
struct body
{
	void operator()(const blocked_range<IntVecIt>&r)const
	{
		for(auto i = r.begin(); i!=r.end(); i++)
		{
			cout<<*i<<' ';
		}
	}
};

int _tmain(int argc, _TCHAR* argv[])
{
	vector<int> vec;
	for(int i=0; i<10; i++)
	{
		vec.push_back(i);
	}
	//执行操作
	while (1)
	{
		parallel_for(blocked_range< IntVecIt>(vec.begin(), vec.end()), body());
		cout<<"sleep...\n";
		Sleep(100);
	}

	return 0;
}

2)、parallel_reduce 适合于需要汇总的情况,即各个数据的结果需要汇总回来

有两种形式: 一种是lamda形式,一种是Body形式

Body定义

Body::Body( Body&, split ); //Splitting constructor.
//Must be able to run concurrently with operator() and method join
Body::~Body(); 

void Body::operator()( Range& r ); 

void Body::join( Body& b ); //Join results.

其中一种lambda的:

template<typename Range , typename Value , typename RealBody , typename Reduction >
Value tbb::parallel_reduce	(
	const Range & 	range,
	const Value & 	identity,
	const RealBody & 	real_body,
	const Reduction & 	reduction 
)	

lambda的实例:

int result = parallel_reduce(
	blocked_range<vector<int>::iterator>(vec.begin(), vec.end()),
	0,
	[](const blocked_range<vector<int>::iterator>& r, int init)->int{
		for(auto a = r.begin(); a!=r.end(); a++)
			init+=*a;
		return init;
	},
	[](int x, int y)->int{
		return x+y;
	}
);
cout<<"result:"<<result<<endl;

3)、parallel_while 有时不知道循环何时结束,即使用for的end未知,在这种情况下可以使用parallel_while

4)、并发容器:concurrent_hash_map\concurrent_vector\concurrent_queue

参考:

  1. my coding.net
  2. Intel Thread Building Blocks (TBB) 入门篇
  3. TBB(Intel Threading Building Blocks)学习笔记
  4. C++中的Lambda表达式详解