transformers.js/tests/generation.test.js


import { pipeline } from '../src/transformers.js';
import { init, m, MAX_TEST_EXECUTION_TIME } from './init.js';

// Initialise the testing environment
init();

describe('Generation parameters', () => {

    // List all models which will be tested
    const models = [
        'MBZUAI/LaMini-Flan-T5-77M', // encoder-decoder
        'MBZUAI/LaMini-GPT-124M', // decoder-only
    ];

    // encoder-decoder model
    it(models[0], async () => {
        const text = 'how can I become more healthy?';

        const generator = await pipeline('text2text-generation', m(models[0]));

        // default
        // NOTE: Since `max_length` defaults to 20, this case also tests that.
        {
            const outputs = await generator(text);

            const tokens = generator.tokenizer.encode(outputs[0].generated_text)
            expect(tokens.length).toEqual(20);
        }

        // max_new_tokens
        {
            // NOTE: Without setting `min_new_tokens` (but setting `max_new_tokens`), 64 tokens are generated.
            // So, the following tests are valid.
            const MAX_NEW_TOKENS = 20;
            const outputs = await generator(text, {
                max_new_tokens: MAX_NEW_TOKENS,
            });

            const tokens = generator.tokenizer.encode(outputs[0].generated_text)
            expect(tokens.length).toEqual(MAX_NEW_TOKENS + 1); // + 1 due to forced BOS token
        }

        // min_length
        {
            // NOTE: Without setting `min_length` (but setting `max_new_tokens`), 64 tokens are generated.
            // So, the following tests are valid.
            const MAX_NEW_TOKENS = 128;
            const MIN_LENGTH = 65;
            const outputs = await generator(text, {
                max_new_tokens: MAX_NEW_TOKENS,
                min_length: MIN_LENGTH,
            });

            const tokens = generator.tokenizer.encode(outputs[0].generated_text)
            expect(tokens.length).toBeGreaterThanOrEqual(MIN_LENGTH);
        }

        // min_new_tokens
        {
            // NOTE: Without setting `min_new_tokens` (but setting `max_new_tokens`), 64 tokens are generated.
            // So, the following tests are valid.
            const MAX_NEW_TOKENS = 128;
            const MIN_NEW_TOKENS = 65;
            const outputs = await generator(text, {
                max_new_tokens: MAX_NEW_TOKENS,
                min_new_tokens: MIN_NEW_TOKENS,
            });

            const tokens = generator.tokenizer.encode(outputs[0].generated_text)
            expect(tokens.length).toBeGreaterThanOrEqual(MIN_NEW_TOKENS);
        }

        await generator.dispose();

    }, MAX_TEST_EXECUTION_TIME);

    // decoder-only model
    it(models[1], async () => {
        const text = "### Instruction:\nTrue or False: The earth is flat?\n\n### Response: ";

        const generator = await pipeline('text-generation', m(models[1]));

        // default
        // NOTE: Since `max_length` defaults to 20, this case also tests that.
        {
            const outputs = await generator(text);
            const tokens = generator.tokenizer.encode(outputs[0].generated_text)
            expect(tokens.length).toEqual(20);
        }

        // max_new_tokens
        {
            const MAX_NEW_TOKENS = 20;
            const outputs = await generator(text, {
                max_new_tokens: MAX_NEW_TOKENS,
            });
            const promptTokens = generator.tokenizer.encode(text)
            const tokens = generator.tokenizer.encode(outputs[0].generated_text)
            expect(tokens.length).toBeGreaterThan(promptTokens.length);
        }

        // min_length
        {
            // NOTE: Without setting `min_length` (but setting `max_new_tokens`), 22 tokens are generated.
            // So, the following tests are valid.
            const MAX_NEW_TOKENS = 10;
            const MIN_LENGTH = 25;
            const outputs = await generator(text, {
                max_new_tokens: MAX_NEW_TOKENS,
                min_length: MIN_LENGTH,
            });

            const tokens = generator.tokenizer.encode(outputs[0].generated_text)
            expect(tokens.length).toBeGreaterThanOrEqual(MIN_LENGTH);
        }

        // min_new_tokens
        {
            // NOTE: Without setting `min_new_tokens` (but setting `max_new_tokens`), 22 tokens are generated.
            // So, the following tests are valid.
            const MAX_NEW_TOKENS = 32;
            const MIN_NEW_TOKENS = 10;
            const outputs = await generator(text, {
                max_new_tokens: MAX_NEW_TOKENS,
                min_new_tokens: MIN_NEW_TOKENS,
            });

            const tokens = generator.tokenizer.encode(outputs[0].generated_text)
            const promptTokens = generator.tokenizer.encode(text)
            expect(tokens.length).toBeGreaterThanOrEqual(promptTokens.length + MIN_NEW_TOKENS);
        }

        await generator.dispose();

    }, MAX_TEST_EXECUTION_TIME);

});
Add support for `min_length` and `min_new_tokens` generation parameters (#308) * Add support for `MinNewTokensLengthLogitsProcessor` * Add support for `MinLengthLogitsProcessor` * Fix `generation_config` defaults * Fix `input_ids_seq_length` * Add unit tests for generation * Fix generation parameters test case * Allow specification of multiple `eos_token_ids` 2023-09-18 05:57:13 +08:00
			`import { pipeline } from '../src/transformers.js';`
			`import { init, m, MAX_TEST_EXECUTION_TIME } from './init.js';`

			`// Initialise the testing environment`
			`init();`

			`describe('Generation parameters', () => {`

			`// List all models which will be tested`
			`const models = [`
Ensure WASM fallback does not crash in GH actions (#402) * Ensure WASM fallback does not crash in GH actions * Add unit test for WordPiece `max_input_chars_per_word` * Cleanup * Set max test concurrency to 1 2023-11-19 14:06:49 +08:00			`'MBZUAI/LaMini-Flan-T5-77M', // encoder-decoder`
			`'MBZUAI/LaMini-GPT-124M', // decoder-only`
Add support for `min_length` and `min_new_tokens` generation parameters (#308) * Add support for `MinNewTokensLengthLogitsProcessor` * Add support for `MinLengthLogitsProcessor` * Fix `generation_config` defaults * Fix `input_ids_seq_length` * Add unit tests for generation * Fix generation parameters test case * Allow specification of multiple `eos_token_ids` 2023-09-18 05:57:13 +08:00			`];`

			`// encoder-decoder model`
			`it(models[0], async () => {`
			`const text = 'how can I become more healthy?';`

			`const generator = await pipeline('text2text-generation', m(models[0]));`

			`// default`
			// NOTE: Since `max_length` defaults to 20, this case also tests that.
			`{`
			`const outputs = await generator(text);`

Fix `text2text-generation` pipeline output inconsistency w/ python library (#384) * Fix `text2text-generation` pipeline inconsistency See https://huggingface.co/docs/transformers/v4.35.0/en/main_classes/pipelines#transformers.Text2TextGenerationPipeline * Fix `text2text-generation` example in docs * Improve text2text-generation output in docs 2023-11-09 22:08:27 +08:00			`const tokens = generator.tokenizer.encode(outputs[0].generated_text)`
Add support for `min_length` and `min_new_tokens` generation parameters (#308) * Add support for `MinNewTokensLengthLogitsProcessor` * Add support for `MinLengthLogitsProcessor` * Fix `generation_config` defaults * Fix `input_ids_seq_length` * Add unit tests for generation * Fix generation parameters test case * Allow specification of multiple `eos_token_ids` 2023-09-18 05:57:13 +08:00			`expect(tokens.length).toEqual(20);`
			`}`

			`// max_new_tokens`
			`{`
			// NOTE: Without setting `min_new_tokens` (but setting `max_new_tokens`), 64 tokens are generated.
			`// So, the following tests are valid.`
			`const MAX_NEW_TOKENS = 20;`
			`const outputs = await generator(text, {`
			`max_new_tokens: MAX_NEW_TOKENS,`
			`});`

Fix `text2text-generation` pipeline output inconsistency w/ python library (#384) * Fix `text2text-generation` pipeline inconsistency See https://huggingface.co/docs/transformers/v4.35.0/en/main_classes/pipelines#transformers.Text2TextGenerationPipeline * Fix `text2text-generation` example in docs * Improve text2text-generation output in docs 2023-11-09 22:08:27 +08:00			`const tokens = generator.tokenizer.encode(outputs[0].generated_text)`
Add support for `min_length` and `min_new_tokens` generation parameters (#308) * Add support for `MinNewTokensLengthLogitsProcessor` * Add support for `MinLengthLogitsProcessor` * Fix `generation_config` defaults * Fix `input_ids_seq_length` * Add unit tests for generation * Fix generation parameters test case * Allow specification of multiple `eos_token_ids` 2023-09-18 05:57:13 +08:00			`expect(tokens.length).toEqual(MAX_NEW_TOKENS + 1); // + 1 due to forced BOS token`
			`}`

			`// min_length`
			`{`
			// NOTE: Without setting `min_length` (but setting `max_new_tokens`), 64 tokens are generated.
			`// So, the following tests are valid.`
			`const MAX_NEW_TOKENS = 128;`
			`const MIN_LENGTH = 65;`
			`const outputs = await generator(text, {`
			`max_new_tokens: MAX_NEW_TOKENS,`
			`min_length: MIN_LENGTH,`
			`});`

Fix `text2text-generation` pipeline output inconsistency w/ python library (#384) * Fix `text2text-generation` pipeline inconsistency See https://huggingface.co/docs/transformers/v4.35.0/en/main_classes/pipelines#transformers.Text2TextGenerationPipeline * Fix `text2text-generation` example in docs * Improve text2text-generation output in docs 2023-11-09 22:08:27 +08:00			`const tokens = generator.tokenizer.encode(outputs[0].generated_text)`
Add support for `min_length` and `min_new_tokens` generation parameters (#308) * Add support for `MinNewTokensLengthLogitsProcessor` * Add support for `MinLengthLogitsProcessor` * Fix `generation_config` defaults * Fix `input_ids_seq_length` * Add unit tests for generation * Fix generation parameters test case * Allow specification of multiple `eos_token_ids` 2023-09-18 05:57:13 +08:00			`expect(tokens.length).toBeGreaterThanOrEqual(MIN_LENGTH);`
			`}`

			`// min_new_tokens`
			`{`
			// NOTE: Without setting `min_new_tokens` (but setting `max_new_tokens`), 64 tokens are generated.
			`// So, the following tests are valid.`
			`const MAX_NEW_TOKENS = 128;`
			`const MIN_NEW_TOKENS = 65;`
			`const outputs = await generator(text, {`
			`max_new_tokens: MAX_NEW_TOKENS,`
			`min_new_tokens: MIN_NEW_TOKENS,`
			`});`

Fix `text2text-generation` pipeline output inconsistency w/ python library (#384) * Fix `text2text-generation` pipeline inconsistency See https://huggingface.co/docs/transformers/v4.35.0/en/main_classes/pipelines#transformers.Text2TextGenerationPipeline * Fix `text2text-generation` example in docs * Improve text2text-generation output in docs 2023-11-09 22:08:27 +08:00			`const tokens = generator.tokenizer.encode(outputs[0].generated_text)`
Add support for `min_length` and `min_new_tokens` generation parameters (#308) * Add support for `MinNewTokensLengthLogitsProcessor` * Add support for `MinLengthLogitsProcessor` * Fix `generation_config` defaults * Fix `input_ids_seq_length` * Add unit tests for generation * Fix generation parameters test case * Allow specification of multiple `eos_token_ids` 2023-09-18 05:57:13 +08:00			`expect(tokens.length).toBeGreaterThanOrEqual(MIN_NEW_TOKENS);`
			`}`

			`await generator.dispose();`

			`}, MAX_TEST_EXECUTION_TIME);`

			`// decoder-only model`
			`it(models[1], async () => {`
			`const text = "### Instruction:\nTrue or False: The earth is flat?\n\n### Response: ";`

			`const generator = await pipeline('text-generation', m(models[1]));`

			`// default`
			// NOTE: Since `max_length` defaults to 20, this case also tests that.
			`{`
			`const outputs = await generator(text);`
			`const tokens = generator.tokenizer.encode(outputs[0].generated_text)`
			`expect(tokens.length).toEqual(20);`
			`}`

			`// max_new_tokens`
			`{`
			`const MAX_NEW_TOKENS = 20;`
			`const outputs = await generator(text, {`
			`max_new_tokens: MAX_NEW_TOKENS,`
			`});`
			`const promptTokens = generator.tokenizer.encode(text)`
			`const tokens = generator.tokenizer.encode(outputs[0].generated_text)`
			`expect(tokens.length).toBeGreaterThan(promptTokens.length);`
			`}`

			`// min_length`
			`{`
			// NOTE: Without setting `min_length` (but setting `max_new_tokens`), 22 tokens are generated.
			`// So, the following tests are valid.`
			`const MAX_NEW_TOKENS = 10;`
			`const MIN_LENGTH = 25;`
			`const outputs = await generator(text, {`
			`max_new_tokens: MAX_NEW_TOKENS,`
			`min_length: MIN_LENGTH,`
			`});`

			`const tokens = generator.tokenizer.encode(outputs[0].generated_text)`
			`expect(tokens.length).toBeGreaterThanOrEqual(MIN_LENGTH);`
			`}`

			`// min_new_tokens`
			`{`
			// NOTE: Without setting `min_new_tokens` (but setting `max_new_tokens`), 22 tokens are generated.
			`// So, the following tests are valid.`
			`const MAX_NEW_TOKENS = 32;`
			`const MIN_NEW_TOKENS = 10;`
			`const outputs = await generator(text, {`
			`max_new_tokens: MAX_NEW_TOKENS,`
			`min_new_tokens: MIN_NEW_TOKENS,`
			`});`

			`const tokens = generator.tokenizer.encode(outputs[0].generated_text)`
			`const promptTokens = generator.tokenizer.encode(text)`
			`expect(tokens.length).toBeGreaterThanOrEqual(promptTokens.length + MIN_NEW_TOKENS);`
			`}`

			`await generator.dispose();`

			`}, MAX_TEST_EXECUTION_TIME);`

			`});`