The National Lung Screening Trial (NLST)
发布时间:2023-12-22浏览量:1. 数据集名称:
The National Lung Screening Trial(NLST)
2. 数据集基本情况:
•项目背景:
–由两个组织共同完成,the National Cancer Institute’s Division of Cancer Prevention (DCP)主导了the Lung Screening Studynetwork(LSS)研究项目,包含美国的10个检查中心,共收集了约35000个病人的相关数据;Division of Cancer Treatment and Diagnosis (DCTD)主导了the American College of Radiology Imaging Network(ACRIN)项目,包含美国的23个检查中心,共收集了约19000个病人的相关数据。项目时间为2002年8月到2004年4月。癌症诊断和死亡情况的项目数据收集截至2009年12月31日,随访时间的中位数是6.5年。该项目旨在于研究在高风险人群中,与拍摄胸片相比,接受CT扫描是否有助于降低肺癌致死率。
•样本量:
–病人数量:53454名患者,受试者被等比例随机分配到两个研究分组中,其中一组接受CT扫描(26722名参与者,约75000份CT扫描结果),另一组拍摄胸片CXR(26732名参与者,约73500份CXR结果)。每隔一年获取一次数据,共得到3次实验数据(T0、T1、T2)。对大约96.6%的病人进行跟踪调查直到项目结束或病人去世。
–可获得的子数据集有15个,记录了CT/CXR扫描结果的异常情况、诊断程序、治疗程序、肺癌/非肺癌病症等(见附录1)
–图像数据: NLST CT Images大约有200000个图像,来自约25000个病人的约75000份的CT扫描结果,;NLST Pathology Images包含451个肺癌病人(Lung Screening Study(LSS)),约1250个H&E-stained slides,病理学家(pathologist)在图像上标注了ROIs,并且以案例报告的形式记录,但无法取得标注后的病理图像。
•其他重要信息:
–参与者要求:55-74岁,30年以上吸烟史,戒烟不超过15年,排除既往肺癌史、过去5年内未患肺癌、过去18个月内拍摄胸部CT、近期部分疾病情况、其他癌症研究受试者、肺部组织移除人员、胸背有金属植入物等情况的参与者
–数据收集:按screening center、性别、年龄、官方注册登记日期进行分层随机抽样;通过调查问卷收集基本demographics信息和病史信息:吸烟史、性别、人种、种族、身高、体重、受教育程度、婚姻状况、既往癌症病史、既往呼吸系统或心血管疾病、工作经历、家庭肺癌病史、饮酒史、被动吸烟情况。
–评估情况:放射科医生会对3次实验的图像进行评估,观察是否存在患肺癌的征兆。评估分为独立观察(isolation read)和对比观察(comparison read)。独立观察不借助其他历史图像:图像本身存在可疑部分(如non-calcified结节、直径不小于4mm的肿块、其他被认为是肺癌相关的异常情况)则标注为positive,还有3种negative标注情况(如临床上与肺癌无关的异常情况、与肺癌无关的minor异常情况、其他不显著的异常情况),此外还有inadequate情况,主要是由于图像质量差,但往往会要求重新拍摄。对比观察借助最近的历史图像,记录过去已观察到的异常的变化情况、独立观察未注意到但通过对比观察发现的异常情况。
–肺癌诊断:positive案例会被建议进行进一步诊断,若确诊肺癌,则会记录相关的诊断信息,包括癌症特征、初期治疗、癌症发展情况cancer progression。
3. 适用任务:
•肺结节分割
•肺结节检测
4. 下载地址:
•https://cdas.cancer.gov/learn/nlst/instructions/
数据需要线上申请,具体流程见附录2
5. 文献出处:
•Aberle, D. R.;Adams, A. M.;Berg, C. D.;Black, W. C.;Clapp, J. D.;Fagerstrom, R. M.;Gareen, I. F.;Gatsonis, C.;Marcus, P. M.;Sicks, J. D.; Natl Lung Screening Trial Res, T., Reduced Lung-Cancer Mortality with Low-Dose Computed Tomographic Screening. NEW ENGLAND JOURNAL OF MEDICINE 2011, 365 (5), 395-409.
附录1
名称 |
样本量 |
基本情况 |
Participant数据集 |
53500名参与者 |
可用于肺癌筛查、发病率和致死率的研究,包含独立观察和对比观察的screen结果。 |
Spiral CT Screening数据集 |
75100份CT |
包含技术参数、reconstruction filter(s)、审阅人ID、是否随访的建议。 |
ChestX-Ray Screening数据集 |
73500份CXR |
包含技术参数、审阅人ID、是否随访的建议。 |
Spiral CT Abnormalities数据集 |
177500份CT扫描结果的异常情况 |
包含异常类型、non-calcified结节或直径不小于4mm的肿块的特征等。如异常描述、直径>= 4mm的非钙化结节或肿块的中心位置、直径>= 4mm的非钙化结节或肿块最长直径、直径>= 4mm的非钙化结节或肿块的边缘描述等变量。 |
Chest X-Ray Abnormalities数据集 |
47200份CXR扫描结果异常情况 |
包含异常类型、non-calcified结节或直径不小于4mm的肿块的特征。 |
Spiral CT Comparison Read Abnormalities数据集 |
31000份CT扫描结果异常情况 |
包含对比观察发现的两种异常类型(所有non-calcified结节或直径不小于4mm的肿块、其他显著的异常情况)、图像变化情况(尺寸和衰减量attenuation)。 |
Chest X-Ray Comparison Read Abnormalities数据集 |
5200份CXR扫描结果异常情况 |
包含对比观察发现的两种异常类型(所有non-calcified结节或直径不小于4mm的肿块、其他显著的异常情况)、图像变化情况(尺寸和衰减量attenuation)。 |
Diagnostic Procedures数据集 |
60900份诊断程序的记录 |
包含被标记为positive的案例的诊断程序、项目期间被确诊为肺癌的相关诊断或staging程序。 |
Medical Complications数据集 |
800份医疗并发症的记录 |
包含与positive标记案例诊断或诊断为肺癌的相关并发症信息。 |
Lung Cancer数据集 |
2100份肺癌记录 |
包含癌症的相关特征、及其他Participant数据集中可能不包含的信息。主要包含tumor的大小、定位信息(0-1变量)、临床阶段信息、肺癌分级等变量。 |
Treatment数据集 |
4600份治疗程序的记录 |
包含肺癌初期治疗过程中所接受的治疗程序。 |
Cause of Death数据集 |
15200份死亡或其他情况的记录 |
包含死亡原因。 |
LSS Non-cancer Condition数据集 |
10900条非癌症病症的记录 |
包含肺癌诊断时或标记为positive后进行肺癌诊断时诊断出的相关疾病情况。 |
ACRINNon-lung-cancer Condition 数据集 |
3400条非癌症病症的记录 |
包含肺癌诊断时或标记为positive后进行肺癌诊断时诊断出的相关疾病情况。 |
LSS HAQ数据集 |
3200份调查表的记录 |
包含LSS每年关于前一年所接受的medical procedures的随机抽样调查结果,用来调查CXR组的受试者接受CT的频率,以及CT组的受试者接受CXR的频率。 |
附录2(NLST数据集申请流程)
大致流程:
创建项目,填写相关信息,通过审批后完成数据传输协议
操作步骤:
填写信息
•个人信息
•项目信息
•所有访问数据的用户(可能不重要)
•然后就可以提交审批了