臨床試験データ保存の進化と独立性【ChatGPT統計解析】

臨床試験データ保存の進化と独立性【ChatGPT統計解析】 | 統計解析 - ChatGPT・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

臨床試験データ保存の進化と独立性【ChatGPT統計解析】

臨床試験データ保存の進化と独立性【ChatGPT統計解析】
臨床試験データの保存はコンピュータへの入力と保存から始まり、解析方法が保存形式に影響を与える重要な因子となる。初期にはアスキーファイルが主流であり、パンチカードやデータシートを用いた労力のかかる作業が行われていた。1980年代にSASが主流となり、SASデータセットを利用した管理が行われたが、履歴管理やダブルエントリーの課題が残った。MUMPS言語も一時期試みられたが、リレーショナルデータベースの台頭により普及には至らなかった。現在ではリレーショナルデータベースが一般的だが、データの独立性確保のため、アスキーファイルの作成機能を考慮すべきである。これによりシステム間での柔軟なデータ交換や電子データの見読性の保証が可能となる。

臨床試験データ保存の進化と独立性【ChatGPT統計解析】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  臨床試験データ保存の進化と独立性【ChatGPT統計解析】

 

 

臨床試験データの保存

 

臨床試験データをコンピュータにより解析を行おうとすれば,まず,データをコンピュータに入力して保存する必要がある.

 

そして,どのようにして臨床試験データを集計・解析するのかということも,コンピュータ上に臨床試験データを保存する方法に対して重大な影響を及ぼす因子である.
その昔,ほとんどの科学計算プログラムがFORTRANによって作成されており,プログラムやデータはパンチカードなどで読み込んでいた時代の末期頃から臨床試験データのコンピュータへの保存が行われるようになった.

 

当時は臨床試験データの保存形式としてはアスキーファイル(テキストファイル)しか考えられなかった.

 

その後,ディスクなどが利用できるようになってもかなりの間は,アスキーファイルが依然として主流を占めていた.

 

臨床試験データを症例報告書からコンピュータに入力するためには,データシートと呼ばれるコーディングシートに転記し,キーパンチャーによりデータ入力をしてもらうことが一般的であった.

 

データシートは各行の各カラム(桁)でのデータ配置を示すものである.

 

このデータシートを利用する方法では,とくにデータ転記は労力がかかり,書き間違いも生じやすいことなどから,症例報告書上に行やカラムの情報を印刷しておいて,直接にデータ入力ができるような症例報告書も工夫されてきた.

 

SASがFORTRANプログラムに替わり臨床試験データの集計・解析の主流を占めるようになり始めた1980年代前半頃でも,アスキーファイルはデータ保存の方法として依然として用いられていた.

 

しかしながら,このデータ形式では,修正のための効率的なツールがエディタ以外にはなかったことやデータ項目ごとの履歴管理が難しいことなどから,コンピュータ技術の発展とともにほかの方法が用いられるようになった.

 

その一つのアイデアがSASデータセットとしての保管であり, SAS/FSPあるいはSAS/AFなどとSCL (Screen Control Language)を組み合わせてSASによるアプリケーションとして臨床試験データの管理が行われた.

 

 

しかしながら, SASデータセットもそのままでは履歴管理することができないという問題やダブルエントリーの実現が難しいというような問題があり,次第にほかの解決策へと向かうようになった.

 

この時期に試みられたほかのデータ保存方法としてはMUMPS言語の利用がある.

 

MUMPS言語とはMassachusetts general hospital Utility Multi -Programming System のことであり, 1966年頃から米国にあるマサチューセッツ総合病院のコンピュータ科学研究所で臨床データならびに病歴情報を処理することを目的として開発されたものである.

 

その後1977年には米国規格協会(ANSI ;American National Standards Institute) , 1992年には国際標準化機構(ISO) , 1995年には日本工業規格(JIS)で標準として制定されており,階層型データ構造,柔軟な可変長の文字列処理機能を持つという特徴がある.

 

日本でも1980年代中頃において臨床試験データの管理への実験的な利用が行われたが,リレーショナルデータベースなどの台頭により広く使用されるまでには至らなかった.

 

そして,現在ではリレーショナルデータベースを利用することが一般的である.

 

SASデータセットやリレーショナルデータベースを利用して臨床試験データを保存した場合の一つの問題として,全てSASなりデータベースに依存し,これらがないとデータを見ることさえできないということがある.

 

アスキーファイルの場合には,とくに機種やシステムに依存することなく,いろいろなデータ処理環境で柔軟に利用することができる.

 

このため,臨床試験データそのものの独立性を高めるためには,臨床試験データの管理はSASやデータベースにより行ったとしても最終的にアスキーファイルを自由に作成できる機能も考慮に入れておくべきである.

 

この機能により,様々なシステム間でのデータ交換にも柔軟に対応することができるようになるというメリットが生じる.

 

アスキーファイルを作成することにより, 求められている電子データの見読性を保証することに繋がる.

 

 

臨床試験データの保存は、コンピュータでの解析を行うための第一歩としてデータを正確に入力し保存することから始まります。この保存方法は、どのようにデータを集計・解析するかという手法に大きく影響を受ける重要な因子です。歴史を振り返ると、臨床試験データのコンピュータ保存は、科学計算プログラムが主にFORTRANで作成されていた時代に始まりました。当時のデータ入力はパンチカードを用いる方式が一般的であり、データの保存形式としてはアスキーファイル(テキストファイル)が唯一の選択肢でした。この方法では、臨床試験データを症例報告書からコンピュータに入力する際に、データシートと呼ばれるコーディングシートにデータを転記し、キーパンチャーが入力作業を行うのが標準的な手順でした。データシートは各行の各カラム(桁)におけるデータ配置を規定し、それに従ってデータを入力するという仕組みでしたが、この方法は労力がかかり、転記ミスが頻発するという課題がありました。これを改善するために、症例報告書自体に行やカラムの情報を印刷し、直接データ入力が可能な形式に改良された報告書も登場しました。その後、コンピュータ技術の進歩に伴い、アスキーファイル以外の保存形式が導入され始めましたが、アスキーファイルはしばらくの間主流であり続けました。1980年代に入ると、SASがFORTRANに代わり臨床試験データの集計や解析の主流ツールとして広く利用されるようになり、SASデータセットを用いたデータ保存が一般化しました。SASはSAS/FSPやSAS/AF、さらにSCL(Screen Control Language)を組み合わせて、データ管理を効率化するアプリケーションを提供しました。しかし、SASデータセットには履歴管理ができない、ダブルエントリーが困難であるといった制約があり、より柔軟で信頼性の高い保存方法を求める声が高まりました。その過程で、MUMPS言語の活用が一部で試みられました。MUMPSは、1966年頃に米国のマサチューセッツ総合病院で開発された階層型データ構造を持つプログラミング言語であり、病歴情報や臨床データの処理に特化していました。この言語は1977年に米国規格協会(ANSI)の標準に、1992年には国際標準化機構(ISO)の標準に、1995年には日本工業規格(JIS)の標準に採用され、柔軟な可変長文字列処理機能や階層型データ構造の利点を活かして一部の臨床データ管理に利用されました。しかし、リレーショナルデータベースが普及するにつれ、MUMPSの利用は限定的となり広く採用されるには至りませんでした。現在では、リレーショナルデータベースが臨床試験データの保存において一般的な選択肢となっています。これらのデータベースは、効率的なデータ管理と柔軟なデータ操作を可能にする一方で、SASやデータベースソフトウェアそのものに依存するという問題があります。例えば、SASデータセットやリレーショナルデータベースに保存されたデータは、それらのソフトウェアがなければデータを確認することさえ困難です。一方、アスキーファイルの場合、特定の機種やシステムに依存せず、さまざまなデータ処理環境で柔軟に利用することが可能です。このため、臨床試験データの独立性を確保するためには、最終的にアスキーファイルとしてデータを出力する機能を持つことが重要です。この機能により、異なるシステム間でのデータ交換が円滑に行えるだけでなく、電子データの見読性が保証されます。特に、規制当局や他の研究機関とのデータ共有が必要な場合には、アスキーファイル形式のデータはその汎用性の高さから非常に有用です。また、アスキーファイルの形式で保存されるデータは、保存方法やフォーマットが明確であり、将来的なデータの再利用性も確保されます。このように、現在の臨床試験データの保存においては、リレーショナルデータベースを基盤としつつも、最終的にはアスキーファイルとしてデータを保存することが推奨されています。これにより、システム間の互換性やデータの長期保存に対する信頼性が向上します。さらに、データ保存に関する最新の技術進歩を取り入れることで、効率的かつ正確なデータ管理が可能となり、臨床試験の信頼性と再現性をさらに高めることが期待されます。このようにして、臨床試験データの保存方法は歴史的な技術の変遷を経て発展してきた背景があり、現在の技術的な選択肢と課題を理解することがデータ管理の適切な方法を選ぶ鍵となります。

 

臨床試験データ保存の進化と独立性【ChatGPT統計解析】


セミナー詳細                    解析ご相談                    LINEでお友達

臨床試験データ保存の進化と独立性【ChatGPT統計解析】

臨床試験データ保存の進化と独立性【ChatGPT統計解析】