Skip to content

Ch12 seq2seq 질문 #12

@diligejy

Description

@diligejy

안녕하세요 539페이지에

디코더는 타깃 시퀀스를 같은 시퀀스로 변하게 학습되지만 1시점 미래로 offset하고, 이러한 학습과정을 교사강요(teacher forcing)라고 부릅니다라고 되어있는데,

  1. 여기서 타깃 시퀀스는 어떤 시퀀스인지,
  2. 타깃 시퀀스를 같은 시퀀스에서 같은 시퀀스는 어떤 시퀀스인지
  3. 변하게 학습한다는 게 어떤 의미인지 모르겠습니다.

teacher forcing에 대한 글들을 찾아봤는데, 티쳐 포싱은 target word(Ground Truth)를 디코더의 다음 입력으로 넣어주는 기법
(https://blog.naver.com/sooftware/221790750668)이라는 내용은 봤습니다.

하지만 정확히 개념을 잡지 못해서 질문을 드립니다.

어떻게 지내세요 ? 라는 3개의 단어가 있다면,

어떻게라는 단어를 다음 단어 예측할 때 반영한다는 건지 아니면 어떤 의미인지 잘 모르겠습니다.

도움을 부탁드리겠습니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions