Catalog-like Data Layer
웹 페이지, 이미지, OCR, DOM snapshot, 리뷰성 텍스트를 entity, attribute, alias, search index로 구조화해 AI 제품이 재사용할 수 있는 데이터 계층으로 만듭니다.
Alwayz Shopport AI & Data Portfolio
쇼포트의 차세대 커머스 카탈로그 시스템과 AI 쇼핑 Agent에 맞춰, LLM extraction, entity/alias/search data layer, grounded AI service, evidence-gated recommendation 경험을 정리했습니다.

웹 페이지, 이미지, OCR, DOM snapshot, 리뷰성 텍스트를 entity, attribute, alias, search index로 구조화해 AI 제품이 재사용할 수 있는 데이터 계층으로 만듭니다.
Gemini/Claude Structured Output, Pydantic schema, selector validation, retry, token/cost tracking으로 속성 추출을 반복 실행 가능한 파이프라인으로 구성했습니다.
RAG/HybridSearch, Google Search Grounding, Tool Calling, source metadata, SSE streaming을 결합해 출처와 실패 케이스를 추적할 수 있는 AI 상담 UX를 만들었습니다.
Memoriz에서 LLM이 추측하지 않도록 evidence-gated policy를 설계하고, 확정된 데이터만 추천 seed와 KPI로 승격했습니다.
Case Evidence
01
Jisoo Data Pipeline / Jisooknows
병원·미용 도메인에서 웹 페이지, ARIA snapshot, screenshot, DOM 후보를 수집하고 Gemini/Claude Structured Output으로 crawl structure와 이벤트·시술 속성을 추출했습니다.
쇼포트의 상품 속성 추출도 상세페이지, 이미지, 후기, 판매 정보가 흩어져 있기 때문에 LLM extraction을 schema, validation, retry, cost 관점으로 운영해야 한다고 봅니다.
02
Jisooknows AI Chat / Grounding
표준 시술/병원 엔티티, 다국어 번역, alias coverage, search dictionary를 정리하고 AI 상담의 RAG/HybridSearch, Google Search Grounding, source metadata와 연결했습니다.
같은 상품이 여러 플랫폼에서 다른 이름, 이미지, 설명으로 판매되는 문제는 entity/alias/search 계층이 먼저 안정화되어야 AI Agent 추천 품질로 이어집니다.
03
Memoriz / Place Evidence / Taste Graph
사진, GPS, OCR, 일정 context를 바탕으로 장소 후보와 확정 장소를 분리하고, 확정된 데이터만 title/summary, taste profile, recommendation seed, KPI 집계로 승격했습니다.
쇼핑 추천에서도 후기·상세페이지·가격·후보 상품명이 섞일 때 AI가 그럴듯한 결론을 내리기보다, 확정 가능한 데이터와 불확실한 후보를 분리하는 품질 정책이 필요합니다.
04
CheckYourHospital / AI SEO-AEO
병원 홈페이지를 7개 카테고리 48개 항목으로 진단하고, AI 검색 mention, machine readability, GEO/AEO score, 의료법 compliance, PDF report를 하나의 제품 흐름으로 연결했습니다.
AI 쇼핑 Agent도 추천 품질을 감으로만 판단하면 개선이 어렵습니다. 실험, 평가, 리포트, source tracking이 있어야 모델·프롬프트·데이터 변경을 빠르게 검증할 수 있습니다.
Contribution Angle
상품 상세페이지, 이미지, 후기, 판매 문구에서 추출할 product/visual/sales/perceived attribute schema 정의
LLM extraction 결과를 validation, confidence, source URL, raw evidence와 함께 저장하는 catalog pipeline 설계
동일 상품/유사 상품의 entity resolution을 alias, image/text evidence, platform-specific metadata로 분리
AI 쇼핑 Agent 응답을 recommendation, rationale, evidence, uncertainty, next question 구조로 나누고 eval set으로 회귀 관리
Visual Proof

요청, 실행, 승인, 산출물, evidence를 남기는 AI workflow 운영 화면입니다.

provider별 실행 상태와 실패 추적을 분리해 운영 리스크를 줄이는 구조입니다.

구조화된 기록을 자연어 검색과 추천 UX로 다시 사용하는 AI product loop입니다.

진단, 평가, 리포트, 제품 반영을 하나의 검증 구조로 닫는 방식입니다.