Archive for April 15th, 2008

Programming Erlang 第12章接口技术 (完整)

Tuesday, April 15th, 2008

接口技术

译者:	gashero

1 端口
2 扩展C程序的接口
- 2.1 C程序
- 2.2 Erlang程序
- 2.3 运行程序
3 open_port
4 内联驱动
5 注意

假设我们需要以Erlang接口运行以C/Python/Shell编写的程序。想要实现这些，我们需要在一个单独的操作系统进程中运行这些程序，而不是在Erlang运行时系统中，他们之间以面向字节的通道完成通信。Erlang端通过 Port 控制。创建端口的进程成为端口的连接进程。连接进程拥有特殊意义：让所有来自扩展程序的消息都会以连接进程的PID来标志。所有的扩展程序消息都会发送到连接进程。

我们可以看看连接进程(C)与端口(P)和扩展操作系统进程的关系。

chpt12.00.jpg 从程序员的角度，端口就像是Erlang进程。你可以发送消息给它，你可以注册(register)它，等等。如果扩展程序crash了，那么连接程序就会收到退出信号，如果连接进程死掉了，扩展进程也会被kill掉。

你可能会好奇与为什么要这么做。很多编程语言允许其他语言编写的程序连接到可执行文件。而在Erlang，我们为了安全性不允许这么做。如果我们连接一个扩展程序到Erlang可执行程序，那么扩展程序的错误将会轻易的干掉Erlang。所以，其他语言编写的程序必须以单独的操作系统进程来运行。 Erlang运行时系统和扩展进程通过字节流通信。

1 端口

创建端口使用如下命令:

Port=open_port(PortName,PortSettings)

这会返回端口，而如下消息是会被发送到端口的(这些消息中PidC是连接进程的PID)：

Port ! {PidC,{command,Data}} ：发送数据到端口

Port ! {PidC,{connect,Pid1}} ：改变控制进程的PID，从PidC到Pid1

Port ! {PidC,close} ：关闭端口

连接进程会从扩展程序收到如下消息:

receive
    {Port,{data,Data}} ->
        ... 数据处理 ...

下面的节，我们会编写Erlang与C结合的简单例子。C程序尽可能的简单以避开细节，直接谈接口技术。

注意，下面的例子对接口机制和协议做了加亮。编码和解码复杂的数据结构是个困难的问题，这里没有谈及。在本章末尾，我们会指出一些用于其他编程语言的接口库。

2 扩展C程序的接口

我们先从C程序开始:

int twice(int x) {
    return 2*x;
}

int sum(int x, int y) {
    return x+y;
}

我们最终目标是从Erlang调用这些例程，我们希望看到的是这个样子(Erlang中):

X1=example1:twice(23),
Y1=example1:sum(45,32),

与用户的设置有关，example1是一个Erlang模块，所有与C接口的细节都被隐藏在了模块example1中。

我们的接口需要一个主程序，用来解码Erlang程序发来的数据。在我们的例子，我们首先定义端口和扩展C程序的协议。我们使用一个超级简单的协议，并展示如何在Erlang和C中实现。协议定义如下：

所有包都以2字节的长度代码开头，后面跟着这些字节的数据。

想要调用 twice(N) ，Erlang程序必须以特定形式编码函数调用。我们假设编码是2字节序列 [1,N] ；参数1表示调用函数 twice ，后面的N代表一个1字节的参数。

调用 sum(N,M) ，我们编码请求到字节序列 [2,N,M] 。

假设返回值都是单一的字节长度的。

扩展C程序和Erlang程序都必须遵守这个协议。作为例子，我们通过 sum(45,32) 来看看工作流程：

端口发送字节序列 0,3,2,45,32 到扩展程序。头两个字节0，3，表示包的长度是3，代码2表示调用扩展的 sum 函数，而 45 和 32 表示调用函数的参数。

扩展程序从标准输入(stdin)读取这5个字节，调用 sum 函数，然后把字节序列 0,2,77 写到标准输出(stdout)。前两个字节表示包长度，后面的77是结果(仍然是1字节长度)。

我们现在写在两端遵守协议的接口，先以C程序开始。

2.1 C程序

扩展的C程序需要编写3个文件：

example1.c ：这个包含了我们需要调用的原始函数。
example1_driver.c ：实现了字节流协议和对 example1.c 的调用例程。
erl_comm.c ：包含读写内存缓冲区的例程。

example1_driver.c

#include <stdio.h>
typedef unsigned char byte;

int read_cmd(byte* buff);
int write_cmd(byte* buff, int len);

int main() {
    int fn, arg1, arg2, result;
    byte buff[100];

    while(read_cmd(buff)>0) {
        fn=buff[0];
        if (fn==1) {
            arg1=buff[1];
            result=twice(arg1);
        } else if (fn==2) {
            arg1=buff[1],
            arg2=buff[2],
            //如果希望调试，可以写到stderr
            //fprintf(stderr,"call sum %i %i\n",arg1,arg2);
            result=sum(arg1,arg2);
        }
        buff[0]=result;
        write_cmd(buff,1);
    }
}

这段代码运行一个无限循环，从标准输入stdin读取调用命令，并且将结果写入到标准输出。

如果希望调试，可以写到stderr，上面的例子里面就有相关的输出语句。

erl_comm.c 是对stdin和stdout读写带有2字节包头的数据包的代码。这么写是允许有分片的。

#include <unistd.h>
typedef unsigned char byte;

int read_cmd(byte* buf);
int write_cmd(byte* buf, int len);
int read_exact(byte* buf, int len);
int write_exact(byte* buf, int len);

int read_cmd(byte* buf) {
    int len;
    if (read_exact(buf,2)!=2)
        return(-1);
    len=(buf[0]<<8) | buf[1];
    return read_exact(buf,len);
}

int write_cmd(byte* buf, int len) {
    byte li;
    li=(len>>8) & 0xff;
    write_exact(&li,1);
    li=len & 0xff
    write_exact(&li,1);
    return write_exact(buf,len);
}

int read_exact(byte* buf, int len) {
    int i, got=0;
    do {
        if ((i=read(0,buf+got,len-got)<=0)
            return i;
        got+=i;
    } while (got<len);
    return len;
}

int write_exact(byte* buf, int len) {
    itn i,wrote=0;
    do {
        if ((i=write(1,buf+wrote,len-wrote)<=0)
            return i;
        wrote+=i;
    } while(wrote<len);
    return len;
}

这段代码处理带有2字节长度包头的数据包，所以用于匹配 {packet,2} 选项的端口驱动程序。

2.2 Erlang程序

Erlang端的驱动程序参考如下:

-module(example1).
-export([start/0,stop/0]).
-export([twice/1,sum/2]).

start() ->
    spawn(fun() ->
            register(example1,self()),
            process_flag(trap_exit,true),
            Port=open_port({spawn,"./example1"},[{packet,2}]),
            loop(Port)
        end).

stop() ->
    example1 ! stop.

twice(X) -> call_port({twice,X}).
sum(X,Y) -> call_port({sum,X,Y}).

call_port(Msg) ->
    example1 ! {call,self(),Msg},
    receive
        {example1,Result} ->
            Result
    end.

loop(Port) ->
    receive
        {call,Caller,Msg} ->
            Port ! {self(),{command,encode(Msg)}},
            receive
                {Port,{data,Data}} ->
                    Caller ! {example1,decode(Data)}
            end,
            loop(Port);
        stop ->
            Port ! {self(),close},
            receive
                {Port,closed} ->
                    exit(normal)
            end;
        {'EXIT',Port,Reason} ->
            exit({port_terminated,Reason})
    end.

encode({twice,X}) -> [1,X];
encode({sum,X,Y}) -> [2,X,Y];

decode([Int]) -> Int.

端口通过如下方式打开:

Port=open_port({spawn,"./example1"},[{packet,2}])

选项 {packet,2} 告诉系统自动在发送数据包时添加一个2字节的包头。所以，会在发送消息 {PidC,{command,[2,45,32]}} 自动加上两字节的长度包头，也就是发送 0,3,2,45,32 到扩展程序。

而输入端口会假设输入数据包也有2字节的长度包头，获取指定长度的数据包之后就会去掉长度包头。

完善程序还需要一个makefile来构建。命令 make example1 用于构建 open_port 调用的扩展程序。注意makefile同时也链接了本章稍后会用到的内联驱动。

makefile

.SUFFIXES: .erl .beam .yrl

.erl.beam:
    erlc -W $<

MODS=example1 example1_lid.c

all: ${MODS:%=%.beam} example1 example1_drv.so

example1: example1.c erl_comm.c example1_driver.c
    gcc -o example1 example1.c erl_comm.c example1_driver.c

example1_drv.so: example1_lid.c example.c
    gcc -o example1_drv.so -fpic -shared example1.c example1_lid.c

clean:
    rm example example1_drv.so *.beam

2.3 运行程序

现在运行程序:

1> example1:start().
<0.32.0>
2> example1:sum(45,32).
77
4> example1:twice(10).
20
...

这就完成了我们的第一个例子。

进入下个主题之前，必须注意的是：

例子程序没有尝试统一Erlang和C程序的整数。这里我们假设整数都是单字节的，并且忽略了精度和符号的问题。在现实的应用中必须注意类型和精度的问题。这是个困难的问题，因为erlang管理着不限制大小的整数，而像C一类的语言却必须管理整数的精度等等。
我们无法在运行扩展程序之前调用对应的erlang的函数(也就是运行 example1:start() 之前不能调用对应函数)。我们更希望可以自动的启动。这在18.7节会详细讲解。

3 open_port

前一节使用了 open_port 却没有介绍具体的参数。只是使用了增加了 {packet,2} 选项的 open_port 而已。 open_port 包含很多参数。

一些常用参数如下：

@spec open_port(PortName,[Opt]) -> Port

PortName是如下之一：

{spawn,Command}

启动一个扩展程序。Command是扩展程序的名字。Command会在Erlang的工作空间以外工作，除非找到了叫做Command的内联驱动。

{fd,In,Out}

允许Erlang进程存取一个已经打开的文件描述符。文件描述符 “In” 用作stdin，而文件描述符 “Out” 用作stdout。查看例子 http://www.erlang.org/examples/examples-2.0.html 。

Opt是如下之一：

{packet,N}

包前面加上N(1,2,4)字节长度的长度包头。

stream

消息不是按照包长度发送的。应用自己知道如何处理这些包。

{line,Max}

以行为单位传递消息。如果一行大于Max字节，则会切割为只有Max字节。

{cd,Dir}

仅用于 {spawn,Command} 选项，扩展程序的初始目录为Dir。

{env,Env}

仅用于 {spawn,Command} 选项。指定扩展程序可用的环境变量为Env。Env是一个列表的 {VarName,Value} 对。两个变量都是字符串。

这并不是完整的 open_port 参数列表。我们可以在参考手册的erlang模块里找到详细的描述。

4 内联驱动

有时候我们希望在Erlang运行时系统内运行一个外语程序。在这种情况下，程序以共享库的方式编写并动态链接到Erlang运行时系统。内联驱动对程序员来说就是一个端口程序，而且与端口程序使用相同的协议。

创建内联驱动是最有效率的工作方式，不过却很危险。任何致命错误都会干掉整个Erlang系统，并且影响到正在工作的所有进程。因为这个原因，非常不推荐内联驱动。

通过刚才的例子讲讲内联驱动。你需要三个文件：

example1_lid.erl ：这个是erlang的服务器。
example1.c ：包含我们需要调用的C函数，跟上一节的一样。
example1_lid.c ：调用 example1.c 中好函数的函数。

Erlang管理接口的代码如下:

-module(example1_lid).
-export([start/0,stop/0]).
-export([twice/1,sum/2]).

start() ->
    start("example1_drv").

start(SharedLib) ->
    case erl_ddl1:load_driver(".",SharedLib) of
        ok -> ok;
        {error,already_loaded} -> ok;
        _ -> exit({error,could_not_load_driver})
    end,
    spawn(fun() -> init(SharedLib) end).

init(SharedLib) ->
    register(example1_lid,self()),
    Port=open_port({spawn,SharedLib},[]),
    loop(Port).

stop() ->
    example1_lid ! stop.

twice(X) -> call_port({twice,X}).
sum(X,Y) -> call_port({sum,X,Y}).

call_port(Msg) ->
    example1_lid ! {call,self(),Msg},
    receive
        {example1_lid,Result} ->
            Result
    end.

loop(Port) ->
    receive
        {call,Caller,Msg} ->
            Port ! {self(),{command,encode(Msg)}},
            receive
                {Port,{data,Data}} ->
                    Caller ! {example1_lid,decode(Data)}
            end,
            loop(Port);
        stop ->
            Port ! {self(),close},
            receive
                {Port,closed} ->
                    exit(normal)
            end;
        {'EXIT',Port,Reason} ->
            io:format("~p~n",[Reason]),
            exit(port_terminated)
    end.

encode({twice,X}) -> [1,X];
encode({sum,X,Y}) -> [2,X,Y].

decode([Int]) -> Int.

对比该程序与较早的版本，看起来基本相同。

驱动程序由 driver 结构体组成。命令 make example1_drv.so 用于构建动态链接库。

// example1_lid.c
#include <stdio.h>
#include "erl_driver.h"

typedef struct {
    ErlDrvPort port;
} example_data;

static ErlDrvData example_drv_start(ErlDrvPort port, char* buff) {
    example_data* d=(example_data*)driver_alloc(sizeof(example_data));
    d->port=port;
    return (ErlDrvData)d;
}

static void example_drv_stop(ErlDrvData handle) {
    driver_free((char*) handle);
}

static void example_drv_output(ErlDrvData handle, char* buff, int bufflen) {
    example_data* d=(example_data*)handle;
    char fn=buff[0], arg=buff[1], res;
    if (fn==1) {
        res=twice(arg);
    } else if (fn==2) {
        res=sum(buff[1],buff[2]);
    }
    driver_output(d->port,&res,1);
}

ErlDrvEntry example_driver_entry={
    NULL,                   // F_PTR init, N/A
    example_drv_start,      // L_PTR start, 在端口打开时调用
    example_drv_stop,       // F_PTR stop, 在端口关闭时调用
    example_drv_output,     // F_PTR output, 当erlang发送数据到端口时
    NULL,                   // F_PTR ready_input
    NULL,                   // F_PTR ready_output
    "example1_drv",         // 驱动的名字
    NULL,                   // F_PTR finish, 卸载(unload)时
    NULL,                   // F_PTR control, port_command回调
    NULL,                   // F_PTR timeout, 保留
    NULL                    // F_PTR outputv, 保留
};

DRIVER_INIT(example_drv) {  //必须与driver_entry中的名字匹配
    return &example_driver_entry;
}

这里时运行程序:

1> c(example_lid).
{ok,example1_lid}
2> example1_lid:start().
<0.41.0>
3> example1_lid:twice(50).
100
4> example1_lid:sum(10,20).
30

5 注意

本章研究了如何以端口来调用扩展程序。除了使用端口协议之外，还可以使用一些其他的BIF来操作端口。这些都在erlang模块的手册中。

在这一点上，你可能会关心如何方便的发送复杂的数据结构，如字符串、元组等等到扩展程序？很不幸，答案是还没有比较简单的方法来实现。所有的端口只是提供了很底层的机制来传输一系列字节而已。同样的问题也发生在Socket编程中。一个Socket提供了数据流与应用交互，对于数据流的解释还需要应用自己做。

不过一些库提供了简单的交互方法，可以查看：

http://www.erlang.org/doc/pdf/erl_interface.pdf

Erl interface (ei) 是一系列的C例程和宏，用于编码和解码Erlang的扩展格式。在Erlang端，一个程序使用 term_to_binary 来将Erlang术语串行化，而在C端ei的例程可以把binary解包。ei也可以用于构造binary，而在Erlang使用 binary_to_term 来解包。

http://www.erlang.org/doc/pdf/ic.pdf

Erlang IDL Compiler (ic) 。这是一个Erlang的OMG IDL编译器实现。

http://www.erlang.org/doc/pdf/jinterface.pdf

Jinterface 是一系列Java到Erlang的接口工具。它提供了Erlang类型到Java类型的完全映射，编码和解码Erlang术语，连接Erlang进程等等。还有一大堆的扩展功能。

Posted in Erlang, 不着边的翻译 | No Comments »

M	T	W	T	F	S	S
« Mar				May »
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

惊帆之静默

Archive for April 15th, 2008

Programming Erlang 第12章接口技术 (完整)

接口技术

1 端口

2 扩展C程序的接口

2.1 C程序

2.2 Erlang程序

2.3 运行程序

3 open_port

4 内联驱动

5 注意

公告

相关信息

Meta

Recent Comments

Categories

Archives

Recent Posts