未登录用户 · 讨论 · 贡献 · 创建账户 · 登录

页面讨论

阅读查看源代码查看历史 artifact

PDF 文档语料

本文属于 artifact 类条目，关联 3 个主题，引用 116 条资料。

PDF 文档语料是当前 Wiki 的文本基础。它包含 116 个 PDF，已识别页数合计约 4153 页。抽取文本可用于搜索和初步聚类，但部分 PDF 的 OCR 噪声较多。

PDF 语料不能直接等同于可靠叙述。它包含任务报告、历史档案、照片 PDF、transcript、technical debriefing、邮件和其他文件。每类文件的证据强度不同。

使用方式

PDF 页面适合用于定位关键词、日期、地点和文件编号。真正引用时应回到原 PDF 页码或原始画面。当前生成的文本摘录只作为入口。

文本抽取状态

当前有 54 个 PDF 产生了文本摘录。部分材料来自扫描件或带有删节标记，抽取结果可能包含乱码、断词和错位。

代表资料

State Department UAP Cable 3, Tbilisi, Georgia, October 30, 2001，Unclassified source，Unknown，810.9 KB，5 页
State Department UAP Cable 4, Ashgabat, Turkmenistan, November 5, 2004，Unclassified source，Unknown，641.3 KB，5 页
State Department UAP Cable 5, Mexico, September 16, 2003，Unclassified source，Unknown，1.2 MB，7 页
18_100754_ General 1946-7_Vol_2，Historical archive，1946，58.6 MB，28 页
18_6369445_General_1948_Vol_1，Historical archive，1948，62.8 MB，28 页
2024 04 30 Composite Sketch，Unclassified source，2024，106.7 KB，1 页
255_413270_UFO's_and_Defense_What_Should_we_Prepare_For，Historical archive，Unknown，31.9 MB，94 页
255_t_763_r1b_transcripts，Historical archive，Unknown，320.5 KB，4 页
331_120752_Numeric_Files_1944–1945_37153_German_Armament_Equipment_Documents，Historical archive，1944，15.2 MB，17 页
341_110448_Records_Relating_to_the_Collection_and_Dissemination_of_Intelligence_1948-1955-TS_CONT_No.2_2-5300-2-5399，Historical archive，1948，9.4 MB，7 页
341_110677_Numerical_File,_5-2500，Historical archive，Unknown，54.7 MB，10 页
342_HS1-416511228_box186_319.1 Flying Discs 1949，Historical archive，1949，117.5 MB，143 页
另有 104 条资料见资料总表。