Alwayz Shopport AI & Data Portfolio

흩어진 도메인 데이터를LLM 속성 추출과AI Agent가 쓰는카탈로그 계층으로 바꿉니다.

쇼포트의 차세대 커머스 카탈로그 시스템과 AI 쇼핑 Agent에 맞춰, LLM extraction, entity/alias/search data layer, grounded AI service, evidence-gated recommendation 경험을 정리했습니다.

AI workflow dashboard showing queue, provider runs, approval gates, and evidence vault
LLM extraction
Catalog layer
Eval loop

Catalog-like Data Layer

웹 페이지, 이미지, OCR, DOM snapshot, 리뷰성 텍스트를 entity, attribute, alias, search index로 구조화해 AI 제품이 재사용할 수 있는 데이터 계층으로 만듭니다.

LLM Structured Extraction

Gemini/Claude Structured Output, Pydantic schema, selector validation, retry, token/cost tracking으로 속성 추출을 반복 실행 가능한 파이프라인으로 구성했습니다.

Grounded AI Agent

RAG/HybridSearch, Google Search Grounding, Tool Calling, source metadata, SSE streaming을 결합해 출처와 실패 케이스를 추적할 수 있는 AI 상담 UX를 만들었습니다.

Recommendation Quality

Memoriz에서 LLM이 추측하지 않도록 evidence-gated policy를 설계하고, 확정된 데이터만 추천 seed와 KPI로 승격했습니다.

Case Evidence

쇼포트 문제와 직접 맞닿는 네 가지 경험

01

Jisoo Data Pipeline / Jisooknows

LLM Extraction Pipeline for Domain Attributes

병원·미용 도메인에서 웹 페이지, ARIA snapshot, screenshot, DOM 후보를 수집하고 Gemini/Claude Structured Output으로 crawl structure와 이벤트·시술 속성을 추출했습니다.

  • Playwright snapshot/screenshot/DOM context를 Gemini에 전달해 crawl structure 생성
  • selector validation과 실패 피드백 재시도로 페이지 구조 변경에 대응
  • Claude wrapper에 Pydantic schema, concurrency semaphore, timeout/retry, token/cost tracking 적용

쇼포트의 상품 속성 추출도 상세페이지, 이미지, 후기, 판매 정보가 흩어져 있기 때문에 LLM extraction을 schema, validation, retry, cost 관점으로 운영해야 한다고 봅니다.

PlaywrightGeminiClaudePydanticStructured OutputPostgreSQL

02

Jisooknows AI Chat / Grounding

Entity, Alias, Search Dictionary Layer

표준 시술/병원 엔티티, 다국어 번역, alias coverage, search dictionary를 정리하고 AI 상담의 RAG/HybridSearch, Google Search Grounding, source metadata와 연결했습니다.

  • 표준 엔티티와 다국어 alias를 search dictionary로 분리
  • clinic RAG와 Google Search Grounding을 질문 유형에 따라 분기
  • tool calls, web references, token usage logs를 메시지 단위로 저장

같은 상품이 여러 플랫폼에서 다른 이름, 이미지, 설명으로 판매되는 문제는 entity/alias/search 계층이 먼저 안정화되어야 AI Agent 추천 품질로 이어집니다.

RAGHybridSearchSearch AliasGoogle Search GroundingTool CallingToken Logs

03

Memoriz / Place Evidence / Taste Graph

Evidence-gated Recommendation Pipeline

사진, GPS, OCR, 일정 context를 바탕으로 장소 후보와 확정 장소를 분리하고, 확정된 데이터만 title/summary, taste profile, recommendation seed, KPI 집계로 승격했습니다.

  • LLM이 장소명을 단독 생성하지 않도록 source-of-truth rule 설계
  • 후보, 확정, area/container fallback을 분리해 hallucination과 비용 제어
  • confirmed place 기반 taste profile, recommendation seed, first CTA funnel, KPI report 구성

쇼핑 추천에서도 후기·상세페이지·가격·후보 상품명이 섞일 때 AI가 그럴듯한 결론을 내리기보다, 확정 가능한 데이터와 불확실한 후보를 분리하는 품질 정책이 필요합니다.

FastAPIFlutterGeminipgvectorRAGKPI Report

04

CheckYourHospital / AI SEO-AEO

AI Visibility and Report Product

병원 홈페이지를 7개 카테고리 48개 항목으로 진단하고, AI 검색 mention, machine readability, GEO/AEO score, 의료법 compliance, PDF report를 하나의 제품 흐름으로 연결했습니다.

  • Playwright crawler와 FastAPI worker로 48개 진단 항목 병렬 실행
  • AI recommendation simulation과 AI SOV snapshot으로 mention rate와 source URLs 집계
  • critical issue gating, benchmark, PDF report, report view로 고객 설명 가능성 확보

AI 쇼핑 Agent도 추천 품질을 감으로만 판단하면 개선이 어렵습니다. 실험, 평가, 리포트, source tracking이 있어야 모델·프롬프트·데이터 변경을 빠르게 검증할 수 있습니다.

Next.jsFastAPIPlaywrightGeminiCloud SQLPDF Report

Contribution Angle

쇼포트에 합류하면 바로 기여할 수 있는 방향

상품 상세페이지, 이미지, 후기, 판매 문구에서 추출할 product/visual/sales/perceived attribute schema 정의

LLM extraction 결과를 validation, confidence, source URL, raw evidence와 함께 저장하는 catalog pipeline 설계

동일 상품/유사 상품의 entity resolution을 alias, image/text evidence, platform-specific metadata로 분리

AI 쇼핑 Agent 응답을 recommendation, rationale, evidence, uncertainty, next question 구조로 나누고 eval set으로 회귀 관리

Visual Proof

운영 가능한 AI 제품으로 닫은 결과물

AI workflow dashboard showing work queue and provider runs

AI Workflow Control

요청, 실행, 승인, 산출물, evidence를 남기는 AI workflow 운영 화면입니다.

Worker status panel showing provider execution states

Worker Run Status

provider별 실행 상태와 실패 추적을 분리해 운영 리스크를 줄이는 구조입니다.

Memoriz natural search screen using stored memory records

Memory Search Reuse

구조화된 기록을 자연어 검색과 추천 UX로 다시 사용하는 AI product loop입니다.

CheckYourHospital validation table for AI search readiness diagnosis

Evaluation Report

진단, 평가, 리포트, 제품 반영을 하나의 검증 구조로 닫는 방식입니다.