Posted on 03-02-2012
Filed Under (技术) by waterlin

最近在尝试用新的方式来写一个新的 Windows 客户端,当作练习。主要是用 C++ 把复杂的算法写成链接库,然后用 C# 做界面前端,从 C# 调用用 C++ 写好的非托管代码。

尝试通过这种方式解决两个问题:

  1. C# 的计算效率问题,虽然从各种资料来看,好像 C# 的托管代码对效率的影响并没有想象的夸张,但不管怎么样,有些东西用 C++ 写就是方便一些;
  2. 用 C++ 可以方便地链接现有的代码库、算法库。

其实,这种架构可以看成是一种 C/S 架构的简化版,但是省去了 Socket 通信这一层。

我采用的是最简单的 P/Invokes 的方式来实现 C# 调用 C++ 链接库,详细的教程,可以看一下 Using dumpbin.exe as an Aid for Declaring P/Invokes 这篇文章。

这里先简单说说两点和代码无关的问题

  1. 如果 C++ 链接库的计算很耗时,一定要在 C# 客户端里开一个线程来处理,否则容易造成死机,这和 MFC 之类的原理一样。
  2. 为了测试你从 C# 链接 C++ 链接库是否成功,可以用 C# 新建一个命令行工程专门测试,用这种方式来测试更加直接与有效。

再谈几点有关技术实现细节的问题,也是我折腾了很久的困惑之处

1. 有关 C++ 链接库 EntryPoint 的名称

我在刚开始从 C# 里链接 C++ 链接库的 API 时,想当然地以为就是函数名称。但是这样操作无论如何也调用不成功,需要在 C++ 链接库里添加一个 extern 关键字,否则链接库编译出来的 API 名称,是混淆过的,不方便你在 C# 里作为 EntryPoint 来书写。

比如说,有如下 C++ 链接库的 API 函数(建议链接库给外面调用的 API 最好用 C 风格来实现,方便减少头文件依赖关系):

extern "C" __declspec(dllexport) bool Function1(const char* param1,
                                                const char* param2,
                                                const char* param3);

翻译成 C# 函数则如下:

[DllImport("Example.dll", EntryPoint = "Function1", ExactSpelling = false]
[return: MarshalAs(UnmanagedType.U1)]
public static extern bool Function1([MarshalAs(UnmanagedType.LPStr)] String param1,
                                    [MarshalAs(UnmanagedType.LPStr)] String param2,
                                    [MarshalAs(UnmanagedType.LPStr)] String param3);

这里注意,找 EntryPoint 一定要准确,否则不容易找到。为了明确地找到 API 函数的 EntryPoint 名称,可以使用 Dumpbin.exe 工具。

dumpbin.exe 工具默认在以下目录:

C:\Program Files\Microsoft Visual Studio 9.0\VC\bin

如果从这个目录里运行 dumpbin.exe 会提示找不到动态链接库 mspdb80.dll 的错误,可以把 dumpbin.exe 拷贝到目录

C:\Program Files\Microsoft Visual Studio 9.0\Common7\IDE

,并从这个目录下运行 dumpbin.exe 来解决这个问题。

运行命令

dumpbin.exe /EXPORTS dllname.dll

后,你会看到很多 ? @ 混合在一起的名称,所以,为了使你在 C# 里的代码可读性比较强,需要改造这些名称。在链接库里,我们可以通过用 extern 关键字来标明,这样生成的链接库 EntryPoint 依然会是原始的名称。

2. C# 程序运行时提示说找不到链接库

如果按上述方法编写好了代码,一运行 C# 程序却提示说:

未处理的"System.DllNotFoundException"类型的异常出现在 example.exe 中。

其他信息: 无法加载 DLL"cppexample.dll": 找不到指定的模块。 (异常来自 HRESULT:0x8007007E)。

这个时候,你需要找一找你的 dll 是否在可执行目录下,或是你写的 dll 是否依赖于其它第三方dll,一定要确保所有的 dll 都能顺利被找到。

3. 参数的映射办法

你的函数肯定有若干个参数,那这些参数应该和 C# 里的类型如何一一对应呢?在 C# 里,这种映射关系叫做 marshal

类型映射,需要仔细检查一下手册,比如说,const char* 就应该这样映射:

[MarshalAs(UnmanagedType.LPStr)]

Using C++ Interop 文章的未尾,有列出一大串的类型映射列表。

小结

初步用 C# 来写界面,感觉更方便、快速,起码比 MFC 来得简单、直接;从 C# 里直接调用 C++ 链接库,也很方便。但这两者结合起来写应用,稳定性还有待进一步测试。

(0) Comments    Read More   
Posted on 02-02-2012
Filed Under (技术) by waterlin

在 C/C++ 多线程编程下,如果不注意,采用普通变量传递参数值给线程会有一些误区,需要特别小心。

下面浏忙绪绪就举两个例子来说明一下。

char* 参数在多线程下出现的怪异现象

最近在用 Boost 库写多线程程序时,需要启动若干个线程,这些线程分别处理不同的事情,线程会获取一个字符串参数,用来标识内容。在编写代码的时候,出现了一个很怪异的现象,例子代码如下:

const int tNum = 4;//并发线程数
vector<boost::thread*> tBox;

for (int i=0; i < tNum; i++ )
{
    char strThread[20];
    sprintf(strThread, "thread%d",i);
    //strThread 字符串是传入的 const char* 类型
    boost::thread* thread_0 = new boost::thread( StreamProcesser,
                                                 param1,
                                                 param2,
                                                 strThread);

    tBox.push_back(thread_0);

    boost::xtime xt;
    boost::xtime_get(&xt, boost::TIME_UTC);
    xt.sec += 2;
    boost::thread::sleep(xt);
}

for (int i=0; i < tNum; i++ )
{
    boost::thread* thread_0 = tBox[i];
    thread_0->join();
    delete thread_0;
}

在线程函数启动参数中,有一个参数是 const char* 类型。如果我在线程中,没有先对 char 字符串拷贝一个副本,则当4个线程都跑起来后,再去读取这个参数,很有可能会读到同一个字符串。

这是因为编译器把 strThread 的地址编码为同一个内存地址造成的,所以,所有的线程读取的都是最后一次设置 strThread 的值。

结论:

  1. 传入 char* 后,一定要对 char 字符串拷贝一个副本,否则这个指针指向的内容很有可能被改变;
  2. 多用 C++ 的 string,少用 char 或是 char*,用值拷贝的方式比单纯传递一个指针要更安全;
  3. 最安全的做法,应该是动态分配一个空间,用来保存传递给线程的参数值,在线程结束后再销毁该值。

int 参数在多线程下被重复赋值的怪异现象

同样,如果传入参数是整型或是其它类型的时候,也会有上述类似的问题。拿 Win32 的 CreateThread 函数来说,同样需要保证传入的参数不被修改,例如下面的代码就非常危险:

DWORD WINAPI CloseThreadFun( LPVOID param)
{
    int* pHandle = (int*)param;
    const int handle = *pHandle;

    //打印句柄
    printf("get handle is %d", handle);

    return 0;
}

int _tmain(int argc, _TCHAR* argv[])
{
    const int THREAD_NUM = 4;

    HANDLE* lphandle = new HANDLE[THREAD_NUM];
    for (int j = 0; j < THREAD_NUM; j++)
    {
        HANDLE hthread;
        hthread = CreateThread(NULL, 0, CloseThreadFun, (LPVOID)&j, 0, NULL);
        lphandle[j] = hthread;
    }

    WaitForMultipleObjects(THREAD_NUM, lphandle, TRUE, INFINITE);

    delete [] lphandle;

    return 0;
}

在调用 CloseThreadFun 来启动一个线程后,j 的值很有可能已经被修改掉了:线程启动总是需要时间的,而参数指针指向地址的内容,很有可能在此期间被修改了。比如,上面的代码,运行后,打印的内容如下:

get handle is 3
get handle is 4
get handle is 4
get handle is 4

这就说明了 j 值被重复修改后,会导致线程参数不对的现象。

解决办法:用一个 int 数组把需要传入到各个线程的参数缓存起来,尽量保证地址不一样。

结论

传入线程的参数,应该尽量采用动态分配内存的方式来生成。否则如果采用临时变量,则随着变量生命周期的消逝,该变量的指针,很有可能会变成一个毫无意义的指针(或是被新的值覆盖,或是被成为一个遗留数)。

采用动态分配的变量作为线程启动时的参数,在线程结束后再销毁这个动态分配的变量,则是一个安全法则。

(0) Comments    Read More   
Posted on 17-01-2012
Filed Under (技术) by waterlin

最近在写 Linux 程序的时候,碰到这样的问题:Log4Cxx 0.10.0 在 Linux 下退出程序时导致程序中断,即提示出现 segmentation fault 错误。

如果你用 gdb 调试,会提示如下信息:

Program received signal SIGSEGV, Segmentation fault.
0x02fa68f3 in apr_vformatter () from /usr/lib/libapr-1.so.0

原因是因为 Log4Cxx 在退出时有非法的资源释放。

有一个解决办法:可以在程序退出时,显示地关闭 Log4Cxx 对象。

I have the same problem if I use log4cxx.AsyncAppender.
I fixed the problem by calling log4cxx::LogManager::shutdown(); before the end of the process.
It's not very clean but it works.

在程序退出时使用语句

log4cxx::LogManager::shutdown();

来清理 log4cxx,而不是让它自己来清理。

注意: 需要在程序所有可能退出的地方,设置这一语句 ,否则依然会有 segmentation fault 的问题。

(0) Comments    Read More   
Posted on 27-12-2011
Filed Under (技术) by waterlin

最近都在写一些跨 Windows 和 Linux 平台的 C++ 代码,略有心得,整理成文,备忘一下。

有关预编译指令

Visual Studio 会自动在源代码里添加

#pragma once

这个指令,在 Linux Gcc 编译器下应该怎么样处理类似的情况呢?

维基百科上有一个权威说法:


http://en.wikipedia.org/wiki/Pragma_once

所以,在编写跨平台的 C++ 代码时,最好使用下面这种方式来获得跨平台的特性:

#pragma once
#ifndef GRANDFATHER_H
#define GRANDFATHER_H

struct foo
{
    int member;
};

#endif /* GRANDFATHER_H */

有关链接库工程的跨平台

Windows 下使用 __declspec(dllexport) 来标明一个动态链接库的函数接口,而在 Linux 下,则完全没有这个必要。

这个时候,如果动态链接库代码需要跨平台,应该怎么处理呢?

你可以用如下宏来进行区分:

#ifdef WIN32
#define EXPORT_XX __declspec(dllexport)
#else
#define EXPORT_XX
#endif

源代码的编码格式

源代码的编码格式,最好统一用 GBK 或是 UTF-8,以避免不同编码器之间转换造成的乱码。

注意代码里的文件名大小写。

Windows 里 include 一个头文件,你的大小写可以随便写。但是在 Linux 上,你得小心了,clsssa.h 你不能写成

#include "ClassA.h"

因为在 Linux 上,文件及目录名是大小写敏感的。

一些类型名称

Windows 处理宽字符集与窄字符集采用的方法,是用宏定义来区分。比如说 TCHAR 在不同的工程下,属于不同的类型。

而在 Linux 下,则需要注意这些问题。为了让你的代码可移植性强。一定要少用 BOOL, TCHAR 这些类型,而要用原生态的 C/C++ 类型,比如说 bool, char 等。

有关 _tmain 等主函数问题。

默认情况下,Visual Studio 新建的 Win32 Console 工程,全是类似于这样的。

int _tmain(int argc, _TCHAR* argv[])
{
}

这些代码,移植到 Linux 下面,就需要我们自己做一部分工作。

如果你在 Visual Studio 用的是 Unicode 编码的,则对应的 Linux 代码应该是另外一套。我则是用宏裁剪了两个主函数出来。如果你有什么更好的方法,可以跟我分享。

注意一些库在 Linux 和 Windows 平台下的不同表现

虽然你的程序可能依赖大量的跨平台库,这些库号称是跨平台的,但是很有可能在不同的平台的表现,会有所不同。例如,log4cxx 在 Linux 和 Windows 下就会有字符集设置的差别

你在编写跨平台代码的时候,就应该特别小心这些库的细微差别,及时调整。

后记

以上是一些跨平台 C/C++ 代码编写的经验,备忘一下,也希望对大家有用。

(0) Comments    Read More   
Posted on 14-12-2011
Filed Under (技术) by waterlin

最近在 Linux 下使用 log4cxx 库,使用的 log4cxx 版本为 0.10.0,结果无法显示中文日志信息。

这可怎么办呢?我不可能把中文日志全部一行一行替换为英文的,这可是一个非常傻B的举动。

经过研究,终于知道需要经过如下步骤才能让 log4cxx 在 Linux 下正常显示中文日志:

  1. 你可以先 locale 检查一下 Linux 终端环境是不是 zh_CN ;

    $ locale
    
  2. 如果你的是 en_US 之类的编码,则需要把 locale 设置为简体中文:
    $ export LC_ALL="zh_CN.UTF-8"
    

    如果你的系统提示说没有安装本字符集,则需要用命令进行安装:

    $ sudo apt-get install language-pack-zh-hans
    
  3. 在程序里设置应用程序的 locale 和终端一样:
    LoggerPtr logger;
    log4cxx::PropertyConfigurator::configure("./log4cxx.properties");
    logger= Logger::getLogger("test") ;
    logger->info(("Start logging"));
    setlocale(LC_ALL, "zh_CN.UTF-8");
    

    关键是最后这一句 setlocale,要设置得和终端一样,都是 zh_CN.UTF-8。

这样,你的程序就可以用 log4cxx0.10.0 输出中文日志信息了。

(1) Comment    Read More   
Posted on 05-09-2011
Filed Under (技术) by waterlin

在 Visual Studio 2008 MFC 工程中,利用 Berkeley DB 来构建数据存储引擎时,在编译 db.h 文件时出现编译错误,错误提示内容如下:

错误    3       error C2143: 语法错误 : 缺少"}"(在"("的前面)        e:\water\berkeleydb\include\db.h        1226

微软的 MSDN 上有对 error C2143 的编译器错误进行解释,不过基本上没有太多可读性、可借鉴性,大意应该是一些宏定义、命名出错等。

最后,还是通过万能的 Google 大神找到了解答方法。错误的原因是 DB_TYPE, DB_UNKNOWN 类型已经在 MFC 系统头文件中被定义过,解决办法之一是在 db.h 中定义 DB_TYPE, DB_UNKNOWN 的语句之前加上如下语句即可:

#ifdef DB_UNKNOWN
#undef DB_UNKNOWN
#endif
#ifdef DBTYPE
#undef DBTYPE
#else
#define DBTYPE BDBTYPE
#endif

看来,C 和 C++ 混在一块,命名、类型定义真是一个大问题。以后碰到类似的问题,也可以采用类似的解决办法。

参考资料:

  1. 解决在vs2008的mfc工程中编译BerkeleyDB出错问题
  2. VS2005中的MFC程序使用BerkeleyDB
  3. MSDN Visual Studio 2010 Compiler Error C2143
(0) Comments    Read More   
Posted on 05-08-2011
Filed Under (技术) by waterlin

Emgu CV 是 OpenCV 跨平台的 C# 封装包,主要是为了方便在 C# 里使用 OpenCV 的库函数,下载和安装都很简单,新建一个 C# 控制窗口程序后,Hello World 例子代码如下:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

using System.Drawing;
using Emgu.CV;
using Emgu.Util;
using Emgu.CV.Structure;

namespace OpenCVTester
{
    class Program
    {
        static void Main(string[] args)
        {
            //The name of the window
            String win1 = "Test Window";

            //Create the window using the specific name
            CvInvoke.cvNamedWindow(win1);

            //Create an image of 400x200 of Blue color
            using (Image<Bgr, Byte> img = new Image<Bgr, byte>(400, 200, new Bgr(255, 0, 0)))
            {
                //Create the font
                MCvFont f = new MCvFont(Emgu.CV.CvEnum.FONT.CV_FONT_HERSHEY_COMPLEX, 1.0, 1.0);
                //Draw "Hello, world." on the image using the specific font
                img.Draw("Hello, world", ref f, new Point(10, 80), new Bgr(0, 255, 0));

                //Show the image
                CvInvoke.cvShowImage(win1, img.Ptr);
                //Wait for the key pressing event
                CvInvoke.cvWaitKey(0);
                //Destory the window
                CvInvoke.cvDestroyWindow(win1);
            }
        }
    }
}

这里需要注意的是,如果用 Visual Studio 2008 来调试上面的代码,则记得要把 OpenCV 相关的动态链接库放到你测试工程的这个目录里:

\bin\Debug

否则在跑到下面这句代码

CvInvoke.cvNamedWindow(win1);

的时候,就会弹出一个莫名其妙的出错框,提示如下错误:

未处理的"System.TypeInitializationException"类型的异常出现在 OpenCVTester.exe 中。

其他信息: "Emgu.CV.CvInvoke"的类型初始值设定项引发异常

看来,C#调试时的程序动态链接库读取位置,还比较特殊呀~~

(0) Comments    Read More   
Posted on 09-07-2011
Filed Under (技术) by waterlin

用 OpenCV 来读取视频,经常需要从指定帧序号的片断开始读取,这个时候,就需要用 cvSetCaptureProperty 结合参数 CV_CAP_PROP_POS_FRAMES 来设定,例子代码如下:

bool PickSomeFrames(const char* filename, int start, int end, char* savePath)
{
    CvCapture* capture = cvCaptureFromAVI(filename);  //读取视频文件

    cvSetCaptureProperty(capture, CV_CAP_PROP_POS_FRAMES, start);

    int count = start;
    while( cvGrabFrame(capture) && count <= end )
    {
        IplImage* pFrame = cvRetrieveFrame(capture);// 获取当前帧

        char test[100];
        sprintf(test,"%s\\%d%s",savePath,count,".jpg");
        cvSaveImage(test,pFrame);

        count++;
    }

    cvReleaseCapture(&capture);

    return false;
}

以上这种方法,支持用多线程的方式,来同时读写视频不同帧序号开始的片断。以上这些代码,在采用多线程来加速视频处理时,特别有用。

(0) Comments    Read More   
Posted on 25-10-2010
Filed Under (技术) by waterlin

最近碰到一个一直以来没有注意的问题,我习惯地使用 wsprintf 来格式化输出字符串,可是,最近在一次收到 http 请求回来的数据后,只截取到了大约一半的字符串。

很奇怪的是,用 lstrcpy 来把结果复制并生成新的字符串,却可以完整的复制。

仔细查了一下 MSDN,发现原来有这么一句话:

To use buffers larger than 1024 bytes, use _snwprintf. For more information, see the documentation for the C run-time library.

原来,wsprintf 的缓冲区有 1024 个字符串的上限,看来以后要注意这个问题了。

(0) Comments    Read More   
Posted on 06-11-2009
Filed Under (技术) by waterlin

默认情况下 Visual Studio 2008 的主题是白底黑字,这样看久了代码,很累。

还好,Visual Studio 提供了强大的自定制功能,我们可以随意设置字体的大小与颜色。当然,最方便的,还是使用其他人配好的颜色,比如说这个 Dark Visual Studio 主题就很不错。

要导入该设置,只需要在 Visual Studio 里的菜单 Tools ==> Import and Export Settings… 里进行导入。如果你对配置进行了若干自定义,则可以用该导出功能进行保存与备份。

原创文章,如转载请注明:转载自细节之锤 [ http://blog.WaterLin.org/ ]

Copyright © WaterLin.org. All rights reserved.

(0) Comments    Read More