IIT Bombay는 자연어를 사용하여 위성 이미지를 디코딩하기위한 AI 모델을 개발합니다.

IIT Bombay는 자연어를 사용하여 위성 이미지를 디코딩하기위한 AI 모델을 개발합니다.

Bombay (IIT Bombay)의 인도 기술 연구소 (Indian Technology Institute)의 연구원들은 기계가 일일 언어 지침을 사용하여 위성 및 무인 그림을 해석 할 수있는 인공 지능 모델 (AI)을 개발하여 재난, 도시 계획 및 농업에 대한 응용 프로그램을 잠재적으로 변형시킬 수 있습니다.

AMVG (Adaptive Modality, Visual Easion)라는이 모델은 IIT Bombay Resource Study Center의 Biplab Balerjee 교수가 수행 한 팀에 의해 설계되었습니다.

거실에있는 고양이의 예술은 인공 지능에 쉽지만 자연 언어 지침을 기반으로 한 복잡한 고해상도 위성 이미지의 디코딩은 오랫동안 도전적인 일이라고 말했다. IIT Bombay의 연구원. AMVG는 사용자가 “범람 한 강 근처의 손상된 건물을 찾는 것”과 같은 문의를 공급하고 수백 개의 복잡한 이미지에서도 몇 분 안에 목표 결과를받을 수 있도록 이러한 격차를 형성하는 것을 목표로합니다.

사진 및 원격 연구를위한 국제 사진 및 원격 센서 저널에 발표 된이 연구는 AMVG가 이미지를 더 빠르고 직관적이며 저렴한 대행사 및 연구원을 더 빠르고 직관적이며 저렴한 대행사를 분석 할 수 있다고 제안합니다.

Choudhury 부인은“원격 연구 이미지는 세부적이지만 자동 해석에는 매우 어렵습니다. 기존 모델은 모호성과 상황에 맞는 명령으로 싸우고 있습니다.

AMVG는 멀티 스테이지 토큰 화 코드 및 AL (Interelect inference)을 포함하여 혁신의 조합을 도입하여 모델이 상황에 맞는 이해를 기반으로 객체를보다 정확하게 식별하는 데 도움이됩니다. 특히 AAL은 “가상 트레이너”처럼 행동하여 명령을 해석 할 때 이미지의 관련 영역에 초점을 맞추도록 시스템을 가르칩니다. Choudhury는“남자가 “연료 탱크 옆에있는 흰색 트럭”을 읽을 때, 우리의 눈은 어디를 볼 곳을 알고있다.

팀은 광범위한 앱을 예측합니다. 재난에 대응하여 대행사는 홍수 또는 지진 후 손상된 인프라를 신속하게 찾을 수 있습니다. 안전기구는 민감한 지역 근처의 위장 된 차량을 식별 할 수있는 반면, 농민들은 단순히 서둘러 패치를 강조하도록 모델을 요청함으로써 작물의 건강을 모니터링 할 수 있습니다.

그러나 Banerjee 교수는 실제 세계의 재난 시나리오에서 AMVG가 아직 테스트되지 않았다고 설명했습니다. 말하기 힌두 인“우리는 예비 연구를 수행했지만 실제 재난 관리 데이터가 부족하여 완전한 평가를 수행 할 수 없었습니다. 그러한 데이터 세트를 만드는 것은 미래의 계획 중 하나입니다.”

팀에 따르면 AMVG는 여전히 종합적인 참고 연구이지만 복잡한 지형에서 손상된 건물, 숨겨진 차량 또는 작물 패턴을 감지 할 때 기존의 접근 방식을 능가합니다.

AMVG가 실시간 통찰력을 제공함으로써 홍수, 지진 또는 화재 중에 정부와 비정부기구를 도울 수 있는지 물었다. Banerjee 교수는 “안전하다. 이것은 우리가 상상하는 가장 강력한 사례 중 하나이다.”

연구원들은 또한 AMVG를 운영 적용으로 가져 오기 위해 협력을 조사합니다. Banerje 교수는“우리는 이미 비슷한 문제에 대해 ISRO와 협력하고있다. “ISRO와의 새로운 협력 라운드는 곧 시작될 것으로 예상되며 VID의 언어로 된 이러한 모델은 엄격하게 고려 될 것입니다.”

AMVG는 위성, 드론 및 항공기 기반 센서 사진에서 고무적인 결과를 보여주었습니다. 다음 단계의 연구에는 다양한 지리적 및 환경 시나리오에서 모델 배열이 포함되어 적응성을 평가합니다.

Tim Iit Bombay는 지형의 중요한 단계에서 Github에서 AMVG 구현을 열었습니다. Choudhury는“오픈 코스는 여전히 원거리 센서에서는 드문 일입니다. 우리는 투명성을 자극하고 진행을 가속화하고 싶었습니다.

이 모델은 약속을 보여 주지만 팀은 제한을 인정합니다. AMVG는 현재 고품질 데이터 세트에 의존하고 있으며 실시간 구현을위한 최적화가 필요합니다. 감각 버전 및 구성 접지 기술에 대한 작업이 진행 중입니다.

Choudhury 부인은“우리의 목표는 원격 민감도에 대한 독특한 이해 시스템을 구축하는 것입니다. 자연 언어를 사용하여 모든 그림을 접지하고 설명하고, 검색하고, 이유가있을 수 있습니다.

게시 -04. 2025 년 9 월. 14:55 IS

참조

You might also like