技術

[xv6 #66] Chapter 5 – File system – File descriptor layer

テキストの74ページ

本文
Unixのインターフェイスの一つのクールな側面は、多くのリソース(コンソールのようなデバイスやパイプやもちろん実際のファイルも)をファイルとして表現しているところである。
ファイルディスクリプタの層は、この特徴を達成するための層である。

xv6は、第0章で見たように、各プロセスが開いてるファイル(ファイルディスクリプタ)のテーブルを各プロセスごとに与える。
開いているそれぞれのファイルは、inodeやパイプ、それにI/Oオフセットを加え、それらをラップするfile構造体として表現される。
1回のopenシステムコールの呼び出しごとに、新しいファイル(新しいfile構造体)を作成する。
複数のプロセスが同じファイルをお互い無関係に開いた場合、それぞれのインスタンスは違うI/Oオフセットを持つだろう。
一方、一つの開いているファイル(file構造体)は、あるプロセスのファイルテーブルに複数回現れる可能性があり、また、複数のプロセスに渡っても同じことが起きる可能性が当然ある。
あるプロセスがopenシステムコールを呼び出したら、dupシステムコールを使ってエイリアスが作成されるか、もしくはforkシステムコールを使って子プロセスに共有されるということが起こるだろう。
リファレンスカウントrefによって、あるファイルが個別に開かれている回数が追跡される。
一つのファイルは、読み込みもしくは書き込み、またはその両方のために開くことが出来る。
readableフィールドとwritableフィールドはこれを追跡する。

file.h

struct file {
  enum { FD_NONE, FD_PIPE, FD_INODE } type;
  int ref; // reference count
  char readable;
  char writable;
  struct pipe *pipe;
  struct inode *ip;
  uint off;
};


// in-core file system types

struct inode {
  uint dev;           // Device number
  uint inum;          // Inode number
  int ref;            // Reference count
  int flags;          // I_BUSY, I_VALID

  short type;         // copy of disk inode
  short major;
  short minor;
  short nlink;
  uint size;
  uint addrs[NDIRECT+1];
};

#define I_BUSY 0x1
#define I_VALID 0x2

// device implementations

struct devsw {
  int (*read)(struct inode*, char*, int);
  int (*write)(struct inode*, char*, int);
};

extern struct devsw devsw[];

#define CONSOLE 1

システム内で開かれている全てのファイルは、グローバルなファイルテーブルであるftableに保持される。
そのファイルテーブルはファイルを割り当てるための関数(filealloc)や、参照の複製を作成するための関数(filedup)や、参照を解放するための関数(fileclose)や、データを読み書きするための関数(fileread, filewrite)を持つ。

file.c

#include "types.h"
#include "defs.h"
#include "param.h"
#include "fs.h"
#include "file.h"
#include "spinlock.h"

struct devsw devsw[NDEV];
struct {
  struct spinlock lock;
  struct file file[NFILE];
} ftable;

void
fileinit(void)
{
  initlock(&ftable.lock, "ftable");
}

// Allocate a file structure.
struct file*
filealloc(void)
{
  struct file *f;

  acquire(&ftable.lock);
  for(f = ftable.file; f < ftable.file + NFILE; f++){
    if(f->ref == 0){
      f->ref = 1;
      release(&ftable.lock);
      return f;
    }
  }
  release(&ftable.lock);
  return 0;
}

// Increment ref count for file f.
struct file*
filedup(struct file *f)
{
  acquire(&ftable.lock);
  if(f->ref < 1)
    panic("filedup");
  f->ref++;
  release(&ftable.lock);
  return f;
}

// Close file f.  (Decrement ref count, close when reaches 0.)
void
fileclose(struct file *f)
{
  struct file ff;

  acquire(&ftable.lock);
  if(f->ref < 1)
    panic("fileclose");
  if(--f->ref > 0){
    release(&ftable.lock);
    return;
  }
  ff = *f;
  f->ref = 0;
  f->type = FD_NONE;
  release(&ftable.lock);
  
  if(ff.type == FD_PIPE)
    pipeclose(ff.pipe, ff.writable);
  else if(ff.type == FD_INODE){
    begin_trans();
    iput(ff.ip);
    commit_trans();
  }
}

// Get metadata about file f.
int
filestat(struct file *f, struct stat *st)
{
  if(f->type == FD_INODE){
    ilock(f->ip);
    stati(f->ip, st);
    iunlock(f->ip);
    return 0;
  }
  return -1;
}

// Read from file f.  Addr is kernel address.
int
fileread(struct file *f, char *addr, int n)
{
  int r;

  if(f->readable == 0)
    return -1;
  if(f->type == FD_PIPE)
    return piperead(f->pipe, addr, n);
  if(f->type == FD_INODE){
    ilock(f->ip);
    if((r = readi(f->ip, addr, f->off, n)) > 0)
      f->off += r;
    iunlock(f->ip);
    return r;
  }
  panic("fileread");
}

//PAGEBREAK!
// Write to file f.  Addr is kernel address.
int
filewrite(struct file *f, char *addr, int n)
{
  int r;

  if(f->writable == 0)
    return -1;
  if(f->type == FD_PIPE)
    return pipewrite(f->pipe, addr, n);
  if(f->type == FD_INODE){
    // write a few blocks at a time to avoid exceeding
    // the maximum log transaction size, including
    // i-node, indirect block, allocation blocks,
    // and 2 blocks of slop for non-aligned writes.
    // this really belongs lower down, since writei()
    // might be writing a device like the console.
    int max = ((LOGSIZE-1-1-2) / 2) * 512;
    int i = 0;
    while(i < n){
      int n1 = n - i;
      if(n1 > max)
        n1 = max;

      begin_trans();
      ilock(f->ip);
      if ((r = writei(f->ip, addr + i, f->off, n1)) > 0)
        f->off += r;
      iunlock(f->ip);
      commit_trans();

      if(r < 0)
        break;
      if(r != n1)
        panic("short filewrite");
      i += r;
    }
    return i == n ? n : -1;
  }
  panic("filewrite");
}

最初の3つは、おなじみの手順に従う。
filealloc関数は、参照されていないファイル(f->ref == 0)を捜すためにファイルテーブルをスキャンし、新しい参照を返す。
filedup関数は、参照カウントをインクリメントする。
fileclose関数は、参照カウントをデクリメントする。
ファイルの参照カウントがゼロに達したら、fileclose関数は、file構造体の裏にあるパイプやinodeを解放する。
どちらを解放するかはfile構造体のtypeフィールドの値に従う。

filestat, fileread, filewrite関数は、ファイルに対するstat, read, writeの実装である。
filestat関数は、inodeに対してのみ機能し、stati関数を呼ぶ。
fileread, filewrite関数は、ファイルが開かれたときのモードにその操作が許可されているかチェックし、それからパイプやinodeの実装を呼び出す。
もし、ファイルがinodeを表現していたら、filereadとfilewriteは、I/Oオフセットの値を、操作のためのオフセットとして使い、そのオフセット値を読み書きした分だけ進める。
パイプにはオフセットの概念はない。
inodeの関数は、その呼び出し側によるロックの制御を要求することを思い出せ。(filestat関数などのilock, iunlockの呼び出し部分)
inodeをロックすることは、読み込みや書き込みのオフセット値の更新がアトミックに行われるという便利な副作用ももたらす。
なので、同じファイルに対して同時に複数の書き込みが発生しても、お互いのデータが上書きされることはない。
が、最終的にはその書き込みはごちゃ混ぜになるだろう。

感想

ファイルディスクリプタの実装についてです。

ファイルディスクリプタでは、パイプとinodeが統合されると書かれています。
inodeの層で実際のファイルとデバイスが統合されるので、最終的に実際のファイル、デバイス、パイプが”ファイル”として扱われることになります。

コード自体は、今まで見てきたコードと同じような感じで、注意深く読まないと勘違いするような部分は特になさげです。
それだからか、この節は一つ一つの関数はサラッと説明されています。
タイトルにも”Code: “が入ってないですね。

次の節で、xv6自体の説明は終わりです。
(その後、Real worldの節とExercisesの節がありますけどね)

さらに付録A, Bがあるのですが、これは以前読むかどうかは未定と書いた覚えがあります。
ザッと目を通したところ、教育用OSの枠内にとどまらない実際の世界の話も書かれてるみたいで、なかなか面白そうなので読んでみたいと思います。

コメントを残す

メールアドレスが公開されることはありません。



※画像をクリックして別の画像を表示