วิธีเพิ่มความเร็วในการอ่านหน้า (จำแนก) พันล้านหน้า

วิธีเพิ่มความเร็วในการอ่านหน้า (จำแนก) พันล้านหน้า

ในหนังสือนักเขียนบทละคร เชอร์แมน เยลเลน เขียนให้กับละครเพลงบรอดเวย์เรื่องเก่า เขามีตัวละครที่ชี้ให้เห็นว่ามงกุฎ (ของยุโรปก่อนสงครามโลกครั้งที่ 1) ล้วนอยู่ในเครดิต กิจการการคลังของประเทศต่างๆ ไม่ได้เปลี่ยนแปลงไปมากนักคุณอาจกล่าวได้ว่ากษัตริย์ก็อาศัยความลับเช่นกัน ในช่วงหลายปีที่ผ่านมา ฉันได้สัมภาษณ์ผู้คนจากสำนักงานกำกับดูแลความปลอดภัยของข้อมูล ซึ่งเป็นส่วนหนึ่งของหอจดหมายเหตุ พวกเขาเป็นวิญญาณที่มีปัญหา

ซึ่งมักจะขุดค้นเอกสารหลายล้านฉบับในแต่ละปี 

จำนวนหน้าเป็นสิบล้านหน้า บางส่วนของหน้าเหล่านั้นที่พวกเขาเห็นว่าควรค่าแก่การแยกประเภทMark Bradley ผู้อำนวยการ ISOO บอกกับ Jason Mille ของเราว่ากระบวนการและระบบที่รองรับนั้นล้าสมัย เขาเรียกกระบวนการจำแนกประเภท-ไม่จำแนกประเภททั้งหมดว่าไม่ยั่งยืน

ฉันสงสัยมาตลอดว่าคนกลุ่มใดกลุ่มหนึ่งสามารถเขียนรีวิว 83,765,475 เพจในหนึ่งปี แล้วตัดสินว่า 46,041,434 นั้นไม่ได้รับการจำแนกประเภทได้อย่างไร ในช่วง 3 ปีล่าสุด กอ.รมน. ทบทวน 273,131,036 หน้า มันไม่เป็นความลับอีกต่อไป 126,764,623 รายการ น่าเสียดาย โควต้าคือ 126,764,624 ผมล้อเล่น.

        Insight by Maximus: การมีข้อมูลเพียงปลายนิ้วจะมีความสำคัญหากเป็นข้อมูลที่ถูกต้องในเวลาที่เหมาะสม ในแบบสำรวจพิเศษของ Federal News Network เราถาม feds เกี่ยวกับความพยายามของหน่วยงานของตนในการเปลี่ยนข้อมูลให้เป็นข่าวกรองที่นำไปปฏิบัติได้ ซึ่งจะนำไปสู่การบริการที่ดีขึ้น

แบรดลีย์กล่าวว่าควรเปลี่ยนกระบวนการนี้ไปสู่ระบบอัตโนมัติของกระบวนการหุ่นยนต์ คลาวด์คอมพิวติ้ง และแมชชีนเลิร์นนิง

ส่วนหุ่นยนต์ควรจะค่อนข้างง่าย เคยดูเครื่องสแกนเชิงพาณิชย์ที่ทำงาน พูด เช็ค หรือแบบฟอร์มหรือไม่? เครื่องดังกล่าวไม่หลับในและไม่ต้องพักดื่มกาแฟหรือบุหรี่

แต่สิ่งที่เกี่ยวกับการตัดสินที่ควรจะไม่เป็นความลับอีกต่อไป?

คำตอบหนึ่งที่เป็นไปได้ หากเป็นการเหยียดหยาม ทำไมไม่จัดประเภททุกอย่างให้ชัดเจนในวันที่กำหนดล่ะ? ในยุคที่ความลับทางไซเบอร์ทุกอย่างที่สำนักงานความมั่นคงแห่งชาติเคยสร้างขึ้นถูกทิ้งลงในเว็บมืด สิ่งที่อาจมีความสำคัญในหน้า 146,366,413 หน้า ISOO กลับไปสู่ความลับที่น่าสะสม

คำตอบที่จริงจังแม้ว่าจะเป็นคำถามจริงๆ เครื่องมืออ่านด้วยเครื่องที่ป้อนด้วยกลไก ขับเคลื่อนด้วยอัลกอริทึม สามารถทำให้งานนี้เป็นไปโดยอัตโนมัติได้หรือไม่ “เพจ” เสกสรรภาพของแผ่นกระดาษพิมพ์ดีดสีเหลืองจากทศวรรษ 1940 ในความเป็นจริง ฉันเดาว่าเนื้อหาเป็นการผสมผสานระหว่างสิ่งเหล่านั้นกับรูปภาพ อีเมล ไดอะแกรม PowerPoint และ “หน้า” ประเภทอื่นๆ อีกนับล้านหน้า

กอ.รมน. น่าจะทำงานอย่างจริงจัง ดังนั้นจึงไม่สามารถทำตรายางกองเอกสารไม่ทางใดก็ทางหนึ่ง งานนี้ไม่เหมือนแบบฝึกหัดการอ่านเร็ว

ในจดหมายของเขาถึงประธานาธิบดีแบรดลีย์ชี้ให้เห็นถึงวิธีอื่นๆ ที่จะทำให้ระบบการจำแนกประเภทใช้งานได้นานขึ้น หนึ่งคือการจำแนกข้อมูลให้น้อยลง อีกประการหนึ่งคือสำหรับหน่วยงานที่จะใช้ประโยชน์สูงสุดจากการกำหนด “CUI” ซึ่งเป็นข้อมูลที่มีการควบคุมและไม่เป็นความลับ แบรดลีย์ขอให้ประธานาธิบดีเข้าแทรกแซงและกดดันประเด็นนี้

แบรดลีย์ชี้ให้เห็นว่าระบบการจำแนกประเภทมีค่าใช้จ่ายมากกว่า 1.8 หมื่นล้านดอลลาร์ต่อปีในการดำเนินการ สำหรับฉันแล้ว กุญแจสำคัญคือการฝึกระบบ AI ควบคู่กับการอ่านด้วยเครื่อง การฝึกอบรมจะต้องมีการป้อนเอกสารเดียวกันกับที่ผู้เชี่ยวชาญกำลังอ่าน เมื่อคนและเครื่องจักรมีการตัดสินใจที่ตรงกัน 85 เปอร์เซ็นต์ จากนั้นจึงส่งต่องานไปที่เครื่องจักร บางทีเครื่องอาจได้รับการฝึกฝนให้ตั้งค่าสถานะเอกสารที่ไม่สามารถตัดสินใจได้ ผู้คนจะจัดการเฉพาะกรณีที่ละเอียดอ่อนเท่านั้นคนอ่านความเร็วจะไม่ทำ Woody Allen อาจอ่าน  War and Peaceใน 20 นาทีและสรุปว่า “มันเกี่ยวกับรัสเซีย” แต่ในโลกของการแบ่งประเภท จะต้องมีวิธีที่ดีกว่านี้

credit : เว็บสล็อต