AI 시대의 “오래된” 데이터가 새로운 금인 이유
오래된 데이터는 새 옷을 입은 빅데이터에 불과한 것이 아닌가?
AI의 혁신으로 인해 데이터의 양과 가치가 기하급수적으로 증가하고 있습니다. 보다 구체적으로, 생성적 인공 지능은 마침내 빅 데이터의 약속을 이행하고 있습니다. 즉, 정보를 실행 가능한 지능으로 전환하는 것입니다.
하지만 여기에 진짜 반전이 있습니다. 이러한 아이디어는 어제의 데이터에서만 나오는 것이 아닙니다. 그것들은 조직이 포착한 모든 것에서 나옵니다. 각 바이트에는 다음 진행 내용이 포함될 수 있습니다.
이것이 바로 기업들이 데이터를 폐기할 대상이 아닌 장기적인 전략적 자산으로 다시 생각하고 있는 이유입니다. 빅데이터는 ‘지금’을 알려줍니다. 과거 데이터는 “이유”를 알려줍니다. 함께, 그들은 지능을 촉진합니다.
Melyssa Banda는 Seagate의 엣지 스토리지 및 서비스 SVP입니다.
레거시 데이터(AI, ML)가 왜 그렇게 중요하며 주로 어디서 발견되나요? (테이프? 오래된 하드 드라이브? 종이?)
AI는 데이터 없이는 존재하지 않으며, 가장 강력한 모델은 시간에 걸친 패턴을 기반으로 합니다. 과거 데이터는 AI에 컨텍스트를 제공하여 예측을 정확성으로, 통찰력을 혁신으로 전환합니다.
이렇게 생각해 보세요. 인류는 메소포타미아의 점토판부터 미국 인구 조사의 펀치 카드에 이르기까지 항상 정보를 보존해 왔습니다. 오늘날 차이점은 위험이 더 높다는 것입니다. AI는 규모와 다양성을 바탕으로 성장합니다. 데이터가 많을수록 더 나은 결과를 얻을 수 있어 조직에 경쟁 우위를 제공할 수 있습니다.
이 데이터가 저장되는 위치의 경우 대규모 배포의 경우 약 87%에 해당하는 대다수가 하드 드라이브에 저장됩니다. 최신 AI 워크로드에는 지속적인 성능과 내구성에 최적화된 확장 가능한 대용량 하드 드라이브가 필요합니다. 더 이상 속도만의 문제가 아니라 대량의 볼륨을 처리하고 장기적인 보존을 보장하며 대규모로 수행하는 것이 중요합니다.
오래된 데이터를 유지하려면 비용이 듭니다. 회사에서 오래된 데이터를 모두 삭제하기로 결정하면 어떻게 되나요?
데이터 삭제는 비용 절감이 아니라 잠재적 가치를 없애는 것입니다. 삭제된 모든 바이트는 더 나은 모델을 훈련하고 자체 통찰력을 구축할 수 있는 기회를 놓치는 것입니다.
금융, 의료, 제조 등의 산업에서는 이상 징후 탐지, 예측 유지 관리, 추세 분석을 위해 기록 데이터가 필수적입니다. 이것이 없으면 AI는 정확성과 투명성, 신뢰성이 떨어집니다.
준수 측면도 있습니다. 규제 기관에서는 AI 의사 결정에 대한 감사 가능성을 점점 더 요구하고 있습니다. 훈련 데이터를 추적할 수 없으면 책임을 입증할 수 없습니다.
과거 데이터를 삭제하는 것은 제도적 기억을 삭제하는 것과 같습니다. 혁신의 원자재가 사라졌습니다. 일단 사라지면 그 가치도 사라집니다.
몇 년 전 고객들은 “왜 우리는 이 모든 데이터를 저장합니까?”라고 물었습니다. 오늘 우리는 “왜 삭제합니까? 저장하도록 도와주세요.”라는 질문을 받습니다.
오래된 데이터를 저장하는 데 드는 OPEX를 줄일 수 있는 솔루션은 무엇입니까?
목표는 데이터를 저렴하게 저장하는 것이 아니라 지능적으로 저장하는 것입니다. 많은 조직이 자주 액세스하는 데이터는 고성능 시스템에 저장하고 오래되거나 액세스 빈도가 낮은 데이터는 비용이 최적화된 계층으로 이동하는 계층형 스토리지 아키텍처로 전환하고 있습니다.
이 접근 방식은 기업이 필요하지 않은 성능에 대해 비용을 지불하지 않도록 보장합니다. 즉, 더 저렴하게 보관하는 것이 아니라 더 스마트하게 보관하세요.
귀하/Seagate는 성명서에서 조직이 데이터 수명주기 관리를 다시 생각해야 한다고 말했습니다. 그러나 기술이 오늘날처럼 빠르게 발전하고 있는 상황에서 이것이 실제로 가능합니까?
AI는 데이터의 가치를 재정의했습니다. 이는 데이터 수명주기 관리가 더 이상 보관을 의미할 수 없음을 의미합니다. 워크로드가 발전함에 따라 적응할 수 있는 유연하고 확장 가능한 인프라를 구축하는 것입니다.
기존의 “저장하고 잊어버리는” 모델은 더 이상 작동하지 않습니다. 데이터를 자본으로 생각하면 역동적이며 이를 추진하는 기술도 마찬가지입니다. 오늘날 라이프사이클 관리를 재고하고 있는 조직은 이를 따라갈 뿐만 아니라 함께 확장할 수 있는 기반을 구축하고 있습니다.
