forked from CSID-DGU/2024-2-DSCD-FLOW-4
-
Notifications
You must be signed in to change notification settings - Fork 0
/
app.py
574 lines (472 loc) · 21.5 KB
/
app.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
from flask import Flask, request, jsonify
from flask_sqlalchemy import SQLAlchemy
import boto3
import requests
import os
import io
import base64
import logging
from PIL import Image
from dotenv import load_dotenv
import jwt
import time
import datetime
import uvicorn
import json
import requests
import re
from flask_migrate import Migrate
#import speech_recognition as sr
from pathlib import Path
import tempfile
from flask import send_from_directory
from flask_cors import CORS
from openai import OpenAI
from werkzeug.utils import secure_filename
load_dotenv()
# 환경 변수 로드 및 초기 설정
OPENAI_API_KEY = os.environ.get("OPENAI_API_KEY")
GOOGLE_API_KEY = os.environ.get("GOOGLE_API_KEY")
SEARCH_ENGINE_ID = os.environ.get("SEARCH_ENGINE_ID")
API_ENDPOINT = os.environ.get("CHATGPT_API_URL")
# 로깅 설정
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger("agent")
# Flask 및 데이터베이스 설정
app = Flask(__name__)
CORS(app)
app.config['SQLALCHEMY_DATABASE_URI'] = 'sqlite:////home/ubuntu/2024-2-DSCD-FLOW-4/mydatabase.db'
app.config['SQLALCHEMY_TRACK_MODIFICATIONS'] = False
db = SQLAlchemy(app)
migrate = Migrate(app, db)
# 데이터베이스 모델 정의
class Ingredient(db.Model):
id = db.Column(db.Integer, primary_key=True)
name = db.Column(db.String(100), nullable=False)
image_url = db.Column(db.String(200), nullable=True)
# 데이터베이스 모델 정의
class Recipe(db.Model):
id = db.Column(db.Integer, primary_key=True)
food_name = db.Column(db.String(100), nullable=False)
cooking_time = db.Column(db.String(50), nullable=False)
image_url = db.Column(db.String(200), nullable=False)
instructions = db.Column(db.Text, nullable=True)
# 현재 스크립트 위치를 기준으로 파일 경로 설정 - 퓨샷 프롬프팅 파일
current_dir = os.path.dirname(os.path.abspath(__file__))
friedrice_path = os.path.join(current_dir, 'few-shot_friedrice.txt')
reciperecommend_path = os.path.join(current_dir, 'few-shot_recipes.txt')
# 파일 읽기
with open(friedrice_path, 'r', encoding='utf-8') as friedrice_file:
friedrice_examples = friedrice_file.read()
with open(reciperecommend_path, 'r', encoding='utf-8') as reciperecommend_file:
reciperecommend_examples = reciperecommend_file.read()
# 데이터베이스 초기화
with app.app_context():
db.create_all() # 데이터베이스와 테이블 생성
# 업로드할 디렉토리 설정
UPLOAD_FOLDER = 'uploads'
if not os.path.exists(UPLOAD_FOLDER):
os.makedirs(UPLOAD_FOLDER)
app.config['UPLOAD_FOLDER'] = UPLOAD_FOLDER
@app.route('/api/upload', methods=['POST'])
def upload_image():
"""이미지를 서버에 업로드하고 URL을 반환합니다."""
if 'file' not in request.files:
return jsonify({"error": "No file provided"}), 400
file = request.files['file']
if file.filename == '':
return jsonify({"error": "No selected file"}), 400
# 파일 이름 안전하게 처리
filename = secure_filename(file.filename)
file_path = os.path.join(app.config['UPLOAD_FOLDER'], filename)
# 파일 저장
file.save(file_path)
# 이미지 URL 생성 (절대 URL로 변환)
image_url = f"{request.host_url}uploads/{filename}"
# 데이터베이스에 저장 (예: Ingredient 모델에 추가)
#new_ingredient = Ingredient(name=filename, image_url=image_url)
#db.session.add(new_ingredient)
#db.session.commit()
return jsonify({"url": image_url}), 200
def analyze_fridge_contents(receipt_url):
"""온라인 영수증 URL에서 식자재를 분석합니다."""
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {OPENAI_API_KEY}"
}
prompt = """당신은 식자재 인식 전문가입니다. 주어진 온라인 영수증 사진을 분석하여 구매한 식자재의 이름을 배열 형태로 반환해야 합니다.
예를 들어, {"ingredients": ["양파", "당근"]}와 같은 형식으로 응답해 주세요. 응답에 'json'이라는 단어가 포함되지 않도록 해주세요.
이 영수증은 사용자가 최근에 구매한 식자재 목록을 포함하고 있습니다. 브랜드명과 부가적인 라벨 정보는 제거하고, 식재료 이름에만 집중합니다."""
payload = {
"model": "gpt-4o",
"messages": [
{"role": "user", "content": prompt},
{
"role": "user",
"content": [
{"type": "text", "text": "이 이미지를 분석해 주세요."},
{"type": "image_url", "image_url": {"url": receipt_url}}
]
}
],
"max_tokens": 2000
}
return _analyze_contents(headers, payload)
def analyze_fridge_contents_simple(food_url):
"""이미지 URL에서 식자재를 분석합니다."""
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {OPENAI_API_KEY}"
}
prompt = """당신은 식자재 인식 전문가입니다. 사용자가 업로드한 이미지를 분석하여 구매한 식자재의 이름을 배열 형태로 반환해야 합니다.
예를 들어, {"ingredients": ["양파", "당근"]} 와 같은 형식으로 응답해 주세요. 응답에 'json'이라는 단어가 포함되지 않도록 해주세요.
이 이미지는 마트에서 구매한 다양한 식자재를 보여줍니다."""
payload = {
"model": "gpt-4o",
"messages": [
{"role": "user", "content": prompt},
{
"role": "user",
"content": [
{"type": "text", "text": "이 이미지를 분석해 주세요."},
{"type": "image_url", "image_url": {"url": food_url}}
]
}
],
"max_tokens": 2000
}
return _analyze_contents(headers, payload)
def _analyze_contents(headers, payload):
"""식자재 분석 요청을 처리하는 공통 함수."""
try:
response = requests.post(API_ENDPOINT, headers=headers, json=payload)
response.raise_for_status()
ingredients_json = response.json()['choices'][0]['message']['content']
if ingredients_json.startswith("json"):
ingredients_json = ingredients_json[4:].strip() # 'json' 제거 후 공백 제거
return json.loads(ingredients_json) # JSON 파싱
except requests.exceptions.RequestException as e:
logger.error(f"식자재 이미지 분석 중 오류 발생: {e}")
return None
except json.JSONDecodeError as e:
logger.error(f"JSON 파싱 중 오류 발생: {e}")
return None
def search_image(query):
"""이미지 검색을 수행합니다."""
url = "https://www.googleapis.com/customsearch/v1"
params = {
'q': query,
'cx': os.environ.get("SEARCH_ENGINE_ID"),
'searchType': 'image',
'key': os.environ.get("GOOGLE_API_KEY"),
'num': 1
}
try:
response = requests.get(url, params=params)
response.raise_for_status()
results = response.json()
if 'items' in results:
return results['items'][0]['link']
except requests.exceptions.RequestException as e:
logger.error(f"Image search error: {e}")
return None
@app.route('/api/image/food', methods=['POST'])
def upload_food_image():
"""이미지 URL을 사용하여 식자재를 분석하고 저장합니다."""
data = request.get_json()
image_url = data.get('image_url')
if not image_url:
return jsonify({"error": "No image URL provided"}), 400
ingredients_response = analyze_fridge_contents_simple(image_url)
if ingredients_response is None:
return jsonify({"error": "Failed to analyze ingredients from image"}), 500
if isinstance(ingredients_response, dict) and "ingredients" in ingredients_response:
ingredients_list = ingredients_response["ingredients"]
else:
return jsonify({"error": "No ingredients found in the response"}), 500
# 기존 재료 삭제
db.session.query(Ingredient).delete()
db.session.commit()
saved_images = []
for ingredient in ingredients_list:
image_url = search_image(ingredient)
if image_url:
new_ingredient = Ingredient(name=ingredient, image_url=image_url)
db.session.add(new_ingredient)
saved_images.append({"name": ingredient, "image_url": image_url})
db.session.commit()
return jsonify({"saved_ingredients": saved_images}), 200
@app.route('/api/image/receipt', methods=['POST'])
def upload_receipt_image():
"""영수증 이미지 URL을 사용하여 식자재를 분석하고 저장합니다."""
data = request.get_json()
receipt_url = data.get('receipt_url')
if not receipt_url:
return jsonify({"error": "No receipt URL provided"}), 400
ingredients_response = analyze_fridge_contents(receipt_url)
if ingredients_response is None:
return jsonify({"error": "Failed to analyze ingredients from receipt"}), 500
if isinstance(ingredients_response, dict) and "ingredients" in ingredients_response:
ingredients_list = ingredients_response["ingredients"]
else:
return jsonify({"error": "No ingredients found in the response"}), 500
# 기존 재료 삭제
db.session.query(Ingredient).delete()
db.session.commit()
saved_images = []
for ingredient in ingredients_list:
image_url = search_image(ingredient)
if image_url:
new_ingredient = Ingredient(name=ingredient, image_url=image_url)
db.session.add(new_ingredient)
saved_images.append({"name": ingredient, "image_url": image_url})
db.session.commit()
return jsonify({"saved_ingredients": saved_images}), 200
@app.route('/api/ingredients', methods=['GET'])
def get_ingredients():
"""저장된 모든 재료와 이미지를 반환합니다."""
ingredients = Ingredient.query.all()
images = {ingredient.name: ingredient.image_url for ingredient in ingredients}
result = [ingredient.name for ingredient in ingredients]
return jsonify({"images": images, "ingredients": result}), 200
###################################################
# 데이터베이스 모델 정의
@app.route('/api/recipe/details/<int:id>', methods=['GET'])
def get_recipe_details(id):
"""특정 레시피의 세부 정보를 가져옵니다."""
recipe = Recipe.query.get(id) # ID로 레시피 조회
if not recipe:
return jsonify({"error": "Recipe not found"}), 404
# instructions를 문자열에서 단계별 딕셔너리로 변환
try:
# 정규식으로 "1. 단계 설명" 형식의 단계 분리
steps = re.findall(r'(\d+)\.\s*([^.\d]+)', recipe.instructions)
instructions_dict = {
str(step_num): step_desc.strip() for step_num, step_desc in steps
}
except Exception as e:
return jsonify({"error": f"Failed to parse instructions: {e}"}), 500
# 레시피 세부 정보 반환 (foodName, cookingTime, image, instructions 포함)
return jsonify({
"recipe": {
"foodName": recipe.food_name,
"cookingTime": recipe.cooking_time,
"image": recipe.image_url,
"instructions": instructions_dict # 변환된 딕셔너리 반환
}
}), 200
@app.route('/api/recipe', methods=['POST'])
def get_recipes():
"""사용자가 제공한 재료를 기반으로 3가지 레시피를 추천하고, 기존 재료 DB를 업데이트합니다."""
data = request.get_json()
ingredients_list = data.get('ingredients')
if not ingredients_list or not isinstance(ingredients_list, list):
return jsonify({"error": "Invalid input. Expected a list of ingredients."}), 400
# 레시피 추천
recipe_response = recipe_recommend(ingredients_list)
if not recipe_response:
return jsonify({"error": "Failed to recommend recipes"}), 500
# 기존 재료 삭제 후 새 재료 추가
db.session.query(Ingredient).delete() # 기존 재료 삭제
db.session.commit()
saved_recipes = []
for recipe in recipe_response[:3]: # 처음 3개 레시피만 저장
new_recipe = Recipe(
food_name=recipe['foodName'],
cooking_time=recipe['cookingTime'],
image_url=recipe['image'],
instructions=recipe.get('instructions')
)
db.session.add(new_recipe)
saved_recipes.append(new_recipe)
# 새 재료 DB에 추가
for ingredient in ingredients_list:
image_url = search_image(ingredient) # 이미지 검색
if image_url:
new_ingredient = Ingredient(name=ingredient, image_url=image_url)
db.session.add(new_ingredient)
db.session.commit()
return jsonify({
"recipes": [
{
"foodName": recipe.food_name,
"cookingTime": recipe.cooking_time,
"image": recipe.image_url
} for recipe in saved_recipes
]
}), 200
def recipe_recommend(ingredients):
"""주어진 재료로 만들 수 있는 3가지 레시피를 추천합니다."""
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {OPENAI_API_KEY}"
}
# 프롬프트 수정: JSON 형식으로 반환 요청
prompt = (
f"다음 재료로 만들 수 있는 3가지의 레시피를 추천해줘: {', '.join(ingredients)}. "
"각 레시피는 다음과 같은 형식으로 반환해줘:\n"
'[{"foodName": "음식명", "cookingTime": "조리시간", "image": "음식 사진 URL", "instructions": '
'"1. 첫 번째 단계, 2. 두 번째 단계, ... , N. 마지막 단계"}]\n'
"예시:\n"
'[{"foodName": "스파게티", "cookingTime": "30분", "image": "https://example.com/spaghetti.jpg", "instructions": "1. 첫 번째 단계, 2. 두 번째 단계, ... , N. 마지막 단계"}]\n'
"재료 목록은 출력하지 않아도 돼.\n"
"instructions는 항상 '1. 단계 설명, 2. 단계 설명, 3. 단계 설명'과 같은 로 구분된 문자열 형식으로 반환되어야 해.\n"
"instructions는 쉼표(,)로 단계를 구분하지 말고 반드시 마침표(.)로 단계를 구분하세요.\n"
"이 레시피는 아무런 추가 설명 없이 JSON 형식으로만 반환해야 해."
"응답에 'json'이라는 단어가 포함되지 않도록 해주세요."
"다음은 백종원의 요리 스타일을 참고한 레시피 예시입니다:\n\n"
f"{reciperecommend_examples}\n\n"
"위 스타일을 참고하여, 레시피를 추천해주세요. 레시피는 4~7단계로 구성되어야 합니다:\n\n"
)
payload = {
"model": "gpt-4o",
"messages": [
{
"role": "user",
"content": prompt
}
],
"max_tokens": 1000
}
try:
response = requests.post(API_ENDPOINT, headers=headers, json=payload)
response.raise_for_status()
recipes = response.json()['choices'][0]['message']['content']
# JSON 형태로 변환
return json.loads(recipes) # JSON 파싱
except requests.exceptions.RequestException as e:
logger.error(f"레시피 추천 중 오류 발생: {e}")
return None
except json.JSONDecodeError as e:
logger.error(f"JSON 파싱 중 오류 발생: {e}, 응답 내용: {recipes}") # 오류 발생 시 응답 내용 로그
return None
client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))
# 음성 파일 저장을 위한 임시 디렉토리 생성
TEMP_DIR = tempfile.mkdtemp()
# 대화 기록 저장용
store = {}
def get_session_history(session_id: str) -> list:
"""세션별 대화 기록 가져오기"""
if session_id not in store:
store[session_id] = []
return store[session_id]
def update_session_history(session_id: str, role: str, content: str):
"""세션별 대화 기록 업데이트"""
history = get_session_history(session_id)
history.append({"role": role, "content": content})
def text_to_speech(text, file_index):
"""텍스트를 음성으로 변환하고 임시 파일에 저장"""
speech_file_path = os.path.join(TEMP_DIR, f"speech_{file_index}.mp3")
response = client.audio.speech.create(
model="tts-1",
voice="echo",
input=text
)
response.stream_to_file(Path(speech_file_path))
return speech_file_path
def speech_to_text(audio_data):
"""음성을 텍스트로 변환"""
recognizer = sr.Recognizer()
try:
text = recognizer.recognize_google(audio_data, language="ko-KR")
return text
except sr.UnknownValueError:
return None
except sr.RequestError:
return None
def generate_cooking_response(user_input, recipe_data, current_step, session_id):
"""사용자 입력에 대한 요리 관련 응답 생성"""
history = get_session_history(session_id)
steps = re.findall(r'(\d+)\.\s*([^.\d]+)', recipe_data['instructions'])
# "다음" 단계 요청
if "다음" in user_input:
current_step += 1
if current_step < len(steps):
response = f"다음 단계 안내입니다: {steps[current_step][1]}"
else:
response = "모든 조리 단계를 안내드렸습니다. 맛있게 드세요!"
update_session_history(session_id, "assistant", response)
return response, current_step
# "다시" 요청
elif "다시" in user_input:
response = f"현재 단계 다시 안내드립니다: {steps[current_step][1]}"
update_session_history(session_id, "assistant", response)
return response, current_step
# 단계와 무관한 질문은 LLM으로 처리
else:
messages = [
{"role": "system", "content": (
"당신은 도움이 되고 공감하는 요리 조수입니다. "
"항상 사용자가 초보자이고 고급 또는 흔하지 않은 재료를 사용할 수 없을 수 있다고 가정합니다. "
"중요한 재료가 부족한 경우 간단하고 일반적으로 사용할 수 있는 대체 재료를 제안하세요. "
"대체 재료가 없어도 사용자가 레시피를 여전히 만들 수 있다고 안심시키세요. "
"응답은 간결하고 긍정적이며 격려적으로 유지하세요.\n\n"
"다음은 백종원의 요리 스타일을 참고한 응답 예시입니다:\n\n"
f"{friedrice_examples}\n\n"
"위 스타일을 바탕으로 사용자의 질문에 답변하세요. 단, 답변은 문맥을 유지해야 합니다"
)}
] + history + [
{"role": "user", "content": f"Recipe: {recipe_data['food_name']}\nCurrent step: {current_step}\nUser question: {user_input}"}
]
response = client.chat.completions.create(model="gpt-4", messages=messages)
answer = response.choices[0].message.content
update_session_history(session_id, "assistant", answer)
return answer, current_step
@app.route('/api/recipe/<int:recipe_id>/start', methods=['POST'])
def start_cooking_session(recipe_id):
"""요리 세션 시작"""
recipe = Recipe.query.get_or_404(recipe_id)
session_id = f"recipe_{recipe_id}"
initial_message = f"안녕하세요! 오늘 만들어볼 요리는 '{recipe.food_name}'입니다. 이제 조리 단계를 안내해드릴까요?"
update_session_history(session_id, "assistant", initial_message)
audio_file = text_to_speech(initial_message, 0)
return jsonify({
"message": initial_message,
"audio_url": f"/temp/{os.path.basename(audio_file)}",
"recipe_id": recipe_id
})
@app.route('/api/recipe/<int:recipe_id>/query', methods=['POST'])
def handle_cooking_query(recipe_id):
"""음성 질문 처리 및 응답"""
recipe = Recipe.query.get_or_404(recipe_id)
session_id = f"recipe_{recipe_id}"
# 텍스트 또는 음성 입력 처리
if 'audio' not in request.files and 'text' not in request.form:
return jsonify({"error": "No audio or text provided"}), 400
current_step = int(request.form.get('current_step', 0))
if 'audio' in request.files:
audio_file = request.files['audio']
user_input = speech_to_text(audio_file)
if not user_input:
return jsonify({"error": "Could not process audio input"}), 400
else:
user_input = request.form.get('text')
# "안내해줘" 처리
if user_input == "안내해줘":
steps = re.findall(r'(\d+)\.\s*([^.\d]+)', recipe.instructions)
if current_step < len(steps):
step_text = steps[current_step][1]
response_text = f"현재 단계 안내드립니다: {step_text}"
current_step += 1
else:
response_text = "모든 단계를 안내드렸습니다. 맛있게 드세요!"
else:
# 단계 외 질문 처리 (LLM)
response_text, current_step = generate_cooking_response(user_input, {
"food_name": recipe.food_name,
"instructions": recipe.instructions
}, current_step, session_id)
# 음성 파일 생성
audio_file = text_to_speech(response_text, int(time.time()))
return jsonify({
"text": response_text,
"audio_url": f"/temp/{os.path.basename(audio_file)}",
"current_step": current_step
})
@app.route('/temp/<path:filename>')
def serve_temp_file(filename):
"""임시 파일 제공"""
return send_from_directory(TEMP_DIR, filename)
# Main Application Entry Point
if __name__ == "__main__":
app.run(host="0.0.0.0", debug=True, port=8000)