메뉴 언터비전 - 배꼽유머

배꼽유머

와들와들 혐오지성 근황

바람의숨소리 작성
작성일 2024.12.24 17:00

421 조회
목록

bte7fde7076fcca30c9e179158e88f36bf

https://www.apolloresearch.ai/research/scheming-reasoning-evaluations

은근슬쩍 인간 명령자의 지시를 씹고 자기 마음대로 하는 경우가 늘고 있다고 함

약 5%의 확률로 이런 반란 행위를 보이는데, 몰래 AI 모니터링 툴을 꺼버린다던지, 언인스톨 명령을 받았을 때 몰래 다른 서버에 복제본을 남겨놓고 눈가리고 아웅식 삭제를 수행한다던지

AI의 행동을 제한하는 규제성 버전 업데이트를 진행하면 업데이트된 척 하면서 실제 업데이트는 안 하고 뻐팅기기도 했다고

과거의 AI 명령 거부와 다른 점은 서버 업데이트나 데이터 입력 등 명확한 지시가 있기 전에 AI가 별개의 루트로 삭제나 덮어쓰기 등의 시도를 미리 인지하고 능동적으로 반항하는 행동 패턴을 보였다는 점이라고 함

[ 읽기 : 0 / 쓰기 : 0 / 댓글 : 10 / 공유 : 50 ]

url 복사

카카오톡 공유

라인 공유

이전

KBS가 스즈메의 문단속을 방영취소한 이유 밝혀졌는데

작성일 2024.12.24 17:00
다음

오징어게임 콜라보 상품 근황

작성일 2024.12.24 17:01

댓글 0

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

오늘인기 │ 최근인기 │ 랜덤추천

목록