メタデータ|【統計学・統計解析コラム】
メタデータとは
メタデータ(Metadata)とは、データに関する情報を記述したデータであり、data about dataと英語で表現されることもあります。
これは、実際にデータベースに格納されている生データと対応して考えられるもので、データベースの構造と内容に関する属性などの情報を意味しています。
すなわち、臨床試験データベースにおけるメタデータとは、「患者背景」テーブルに含まれる「患者ID」という項目は5バイト長の文字型データ、「年齢」という項目は整数型データ、「性別」という項目は1バイト長の文字型データであり、コードとして「M:男性」と「F:女性」を使用するというような情報のことを意味します。
このため、メタデータを把握することにより、データベースの構造や内容を把握することができるようになります。
一般にこれらのメタデータは個別のアプリケーションごとに定義されていることが多いです。
しかしながら、臨床試験データベースのようにデータの構造が一つの臨床試験ごとに変化するという状況に柔軟に対応して複数のデータベースを総括・管理するという目的のためには、メタデータ自体をデータベースとして管理して各臨床試験ごとのデータベースを作成するという方法を用いることができます。
メタデータ管理作業の効率化
さらに、メタデータとして管理する情報の中に、項目名のラベル、SASの変数名、入力画面のレイアウト情報なども含めることにより、効率化すなわち作業付加と管理コストの増加抑制を実現することができます。
現実に「臨床試験データ管理システム」では、このようなメタデータ管理システムとして構築されることが最も効率的な方法であり、ユーザーにとって各臨床試験で個別に作成されたデータベースを見た場合には、単なる普通のデータベースにアプリケーションにすぎないと感じられるようにしておくべきです。
このようにメタデータ自体を統合し一元的な管理を効率的に行うためには、メタデータについても、全ての臨床試験を通じて用いられる「Global Level」や、その薬剤を通じて用いられる「Drug Level」などといった階層による管理を行うことが適切です。適用するデータモデルも慎重に検討しておく必要があります。
さらに一元管理されているメタデータに対して、定義の変更へ削除・追加を行う場合の管理体制を的確に構築することができれば、臨床試験データ管理の標準化に大きく寄与することができます。
また、メタデータを利用することによりSASなどといったほかのアプリケーションなどからのアクセスも容易に行うことができるようになり、臨床試験データを様々な場面で効率的に参照することができるようになります。
関連記事