엄격하고 유연한 방식으로 안정적인 AI 제어 시스템을 만들고 검증합니다.

엄격하고 유연한 방식으로 안정적인 AI 제어 시스템을 만들고 검증합니다.



엄격하고 유연한 방식으로 안정적인 AI 제어 시스템을 만들고 검증합니다.

신경망은 엔지니어가 로봇 컨트롤러를 설계하는 방식에 엄청난 영향을 미쳐 더욱 적응적이고 효율적인 기계를 촉진했습니다. 그래도 이러한 뇌와 유사한 머신 러닝 시스템은 양날의 검입니다. 복잡성으로 인해 강력해지지만, 신경망으로 구동되는 로봇이 작업을 안전하게 완료할 수 있다는 보장도 어렵습니다.

안전성과 안정성을 검증하는 전통적인 방법은 랴푸노프 함수라고 불리는 기술을 사용하는 것입니다. 값이 지속적으로 감소하는 랴푸노프 함수를 찾을 수 있다면 더 높은 값과 관련된 안전하지 않거나 불안정한 상황은 결코 발생하지 않을 것입니다. 그러나 신경망으로 제어되는 로봇의 경우 랴푸노프 조건을 검증하기 위한 이전 접근 방식은 복잡한 기계에 잘 확장되지 않았습니다.

MIT의 컴퓨터 과학 및 인공지능 연구실(CSAIL)과 다른 곳의 연구자들은 이제 더 정교한 시스템에서 랴푸노프 계산을 엄격하게 인증하는 새로운 기술을 개발했습니다. 그들의 알고리즘은 랴푸노프 함수를 효율적으로 검색하고 검증하여 시스템에 대한 안정성을 보장합니다. 이 접근 방식은 항공기와 우주선을 포함한 로봇과 자율 주행차의 안전한 배치를 가능하게 할 수 있습니다.

이전 알고리즘보다 성능이 뛰어나기 위해 연구자들은 훈련 및 검증 프로세스에 대한 검소한 지름길을 찾았습니다. 그들은 더 저렴한 반례(예: 컨트롤러를 떨어뜨릴 수 있는 센서의 적대적 데이터)를 생성한 다음 로봇 시스템을 최적화하여 이를 설명했습니다. 이러한 엣지 케이스를 이해하면 기계가 어려운 상황을 처리하는 방법을 배우는 데 도움이 되었으며, 이를 통해 이전에는 불가능했던 더 광범위한 조건에서 안전하게 작동할 수 있었습니다. 그런 다음 확장 가능한 신경망 검증기인 α,β-CROWN을 사용하여 반례를 넘어 엄격한 최악의 시나리오 보장을 제공할 수 있는 새로운 검증 공식을 개발했습니다.

“우리는 휴머노이드와 로봇견과 같은 AI 제어 기계에서 인상적인 경험적 성과를 보았지만, 이러한 AI 컨트롤러는 안전에 중요한 시스템에 필수적인 형식적 보장이 부족합니다.” MIT 전기공학 및 컴퓨터 과학(EECS) 박사과정 학생이자 CSAIL 제휴자인 Lujie Yang은 말합니다. 그는 Toyota Research Institute 연구원 Hongkai Dai SM ’12, PhD ’16과 함께 이 프로젝트에 대한 새로운 논문의 공동 주 저자입니다. “저희 연구는 신경망 컨트롤러의 성능 수준과 실제 세계에서 더 복잡한 신경망 컨트롤러를 배치하는 데 필요한 안전 보장 간의 격차를 메웁니다.” Yang은 말합니다.

디지털 데모를 위해 팀은 라이더 센서가 장착된 쿼드로터 드론이 2차원 환경에서 어떻게 안정화되는지 시뮬레이션했습니다. 그들의 알고리즘은 라이더 센서가 제공하는 제한된 환경 정보만을 사용하여 드론을 안정적인 호버 위치로 성공적으로 안내했습니다. 다른 두 실험에서 그들의 접근 방식은 더 광범위한 조건에서 두 개의 시뮬레이션된 로봇 시스템, 즉 역진자와 경로 추적 차량의 안정적인 작동을 가능하게 했습니다. 이러한 실험은 겸손하지만 신경망 검증 커뮤니티가 이전에 할 수 있었던 것보다 비교적 더 복잡합니다. 특히 센서 모델이 포함되어 있기 때문입니다.

캘리포니아 대학교 샌디에이고 캠퍼스의 컴퓨터 과학 및 공학과 조교수인 시쿤 가오는 “일반적인 머신 러닝 문제와 달리, 랴푸노프 함수로서 신경망을 엄격하게 사용하려면 어려운 전역 최적화 문제를 풀어야 하며, 따라서 확장성이 핵심 병목 현상입니다.”라고 말했습니다. 그는 이 작업에 참여하지 않았습니다. “현재 작업은 제어 문제에서 랴푸노프 함수로서 신경망을 특정 용도로 사용하는 데 훨씬 더 잘 맞는 알고리즘적 접근 방식을 개발함으로써 중요한 기여를 합니다. 기존 접근 방식보다 확장성과 솔루션의 품질이 인상적으로 향상되었습니다. 이 작업은 신경 랴푸노프 방법에 대한 최적화 알고리즘의 추가 개발과 제어 및 로봇 공학 전반에 대한 딥 러닝의 엄격한 사용을 위한 흥미로운 방향을 열어줍니다.”

양과 그녀의 동료들의 안정성 접근 방식은 안전을 보장하는 것이 중요한 광범위한 적용 가능성이 있습니다. 항공기와 우주선과 같은 자율 주행 차량의 더 부드러운 주행을 보장하는 데 도움이 될 수 있습니다. 마찬가지로, 물품을 배달하거나 다양한 지형을 매핑하는 드론은 이러한 안전 보장의 혜택을 볼 수 있습니다.

여기서 개발된 기술은 매우 일반적이며 로봇 공학에만 국한되지 않습니다. 동일한 기술이 앞으로 생물의학이나 산업 가공과 같은 다른 응용 분야에도 도움이 될 가능성이 있습니다.

이 기술은 확장성 측면에서 이전 연구보다 업그레이드되었지만, 연구자들은 더 높은 차원의 시스템에서 어떻게 더 나은 성능을 낼 수 있는지 탐구하고 있습니다. 그들은 또한 이미지와 포인트 클라우드와 같은 라이더 판독을 넘어서는 데이터를 고려하고 싶어합니다.

미래 연구 방향으로, 팀은 불확실한 환경에 있고 교란을 받는 시스템에 대해서도 동일한 안정성 보장을 제공하고자 합니다. 예를 들어, 드론이 강한 돌풍에 직면하더라도, 양과 그녀의 동료들은 드론이 여전히 안정적으로 비행하고 원하는 작업을 완료할 수 있도록 보장하고자 합니다.

또한, 그들은 그들의 방법을 최적화 문제에 적용할 계획인데, 그 목표는 로봇이 안정을 유지하면서 작업을 완료하는 데 필요한 시간과 거리를 최소화하는 것입니다. 그들은 그들의 기술을 휴머노이드와 다른 실제 기계로 확장할 계획인데, 여기서 로봇은 주변 환경과 접촉하는 동안 안정을 유지해야 합니다.

MIT의 EECS, 항공 및 우주 항공, 기계 공학의 Toyota 교수이자 TRI의 로봇 연구 부사장이며 CSAIL 회원인 Russ Tedrake가 이 연구의 수석 저자입니다. 이 논문은 또한 캘리포니아 대학교 로스앤젤레스 박사 과정 학생인 Zhouxing Shi와 준교수인 Cho-Jui Hsieh, 일리노이 대학교 어바나-샴페인 조교수인 Huan Zhang의 공로를 인정합니다. 이들의 연구는 부분적으로 Amazon, National Science Foundation, Office of Naval Research, Schmidt Sciences의 AI2050 프로그램의 지원을 받았습니다. 연구자들의 논문은 2024년 International Conference on Machine Learning에서 발표될 예정입니다.



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *