
AI Radar: AI chemist가 보여준 agent R&D 경계
OpenAI가 2026년 6월 17일에 공개한 AI chemist 실험은 그냥 “AI가 신약 후보를 만들었다”로 읽기에는 아깝다. 내가 더 크게 본 부분은 agent가 연구 업무를 어디까지 닫힌 루프로 가져갈 수 있는지다. 문헌을 읽고, 가설을 세우고, 후보를 설계하고, 결과를 평가해서 다음 실험으로 이어가는 흐름. 이건 챗봇의 답변 품질 문제가 아...

OpenAI가 2026년 6월 17일에 공개한 AI chemist 실험은 그냥 “AI가 신약 후보를 만들었다”로 읽기에는 아깝다. 내가 더 크게 본 부분은 agent가 연구 업무를 어디까지 닫힌 루프로 가져갈 수 있는지다. 문헌을 읽고, 가설을 세우고, 후보를 설계하고, 결과를 평가해서 다음 실험으로 이어가는 흐름. 이건 챗봇의 답변 품질 문제가 아...

AI agent 이야기는 보통 모델 성능, prompt, workflow builder에서 시작한다. 그런데 실제 서비스에 붙이려고 하면 질문이 바뀐다. 이 agent가 누구 권한으로, 어떤 도구를, 어느 범위까지 실행할 수 있는가. 오늘은 그 지점을 기준으로 Arcade.dev를 봤다. Arcade는 2026년 6월 15일에 Series A 6천...

터미널 화면을 다듬다 보니, 먼저 막히는 지점은 색이나 layout이 아니었다. TUI가 뜬 뒤에 Codex가 바로 실패하면 화면이 아무리 좋아도 첫 경험이 망가진다. 특히 모델 이름이 현재 계정에서 지원되지 않거나, provider 로그인이 빠져 있으면 agent pane은 시작하자마자 error log로 채워진다. 그래서 이번에는 Agent De...

Review Trends가 시간 범위와 filter를 갖추고 나니, 다음은 기록으로 넘기는 일이었다. dashboard에서 본 내용을 다시 손으로 정리하면 흐름이 끊긴다. 현재 trend 상태를 그대로 Markdown으로 뽑을 수 있어야 한다. 이번에는 trend snapshot export를 추가했다. 저장소: hoonapps/agent-deck...

trend filter를 붙이고 나니 다음 문제는 시간 범위였다. 전체 session을 다 훑으면 오래된 review까지 섞인다. 하루 작업을 볼 때는 오늘 작업만 보고 싶고, 흐름을 빠르게 볼 때는 최근 몇 개 session만 보고 싶다. 이번에는 Review Trends에 time window를 추가했다. 저장소: hoonapps/agent-d...

Review Trends를 붙이고 나니 전체 집계만 보는 화면은 금방 한계가 생긴다. review가 쌓일수록 필요한 질문은 더 좁아진다. codex가 남긴 open finding만 보고 싶다 high severity만 보고 싶다 fixed 처리한 finding은 trend에서 빼고 싶다 이번에는 trend에도 severity, agent, sta...

Review Inbox를 붙이고 나니 다음으로 필요한 화면이 보였다. 지금 당장 처리해야 하는 high finding을 보는 것도 중요하지만, 같은 위치에서 문제가 반복되는지도 봐야 한다. 이번에는 dashboard에 cross-session review trend를 추가했다. 저장소: hoonapps/agent-deck 이번 커밋: b9f0c4...

finding 단위 상태를 붙이고 나니 다음 문제가 바로 보였다. 중요한 review 항목은 세션 안에 묻히면 안 된다. 이번에는 dashboard 상단에 open high finding만 모아보는 Review Inbox를 붙였다. 저장소: hoonapps/agent-deck 이번 커밋: 5eb2087 이번 변경 dashboard 상단에 Rev...

직전 단계에서 session 단위 status를 붙였다. 이번에는 한 단계 더 내려가서 review finding 단위의 처리 상태를 dashboard에 붙였다. 저장소: hoonapps/agent-deck 이번 커밋: dc0fab6 이번 변경 각 review finding에 네 가지 상태를 둘 수 있게 했다. open accepte...

Agent Deck dashboard가 세션을 보여주고, findings를 필터링하고, blog draft를 내려받는 단계까지 왔다. 이번에는 세션을 발행 큐로 다루기 위한 작은 상태 마커를 붙였다. 저장소: hoonapps/agent-deck 이번 커밋: 23b2685 이번 변경 dashboard에서 각 transcript session을 세...